Trong bài viết này, hãy cùng TTnguyen tìm hiểu khái niệm kiểm định giả thuyết thống kê kèm theo ví dụ và bài tập thực tế để giúp bạn rèn luyện kỹ năng kiểm định giả thuyết một cách hiệu quả.
Xem thêm:
I. Lý thuyết kiểm định giả thuyết thống kê
Phân biệt giả thuyết và giả thiết
Giả thuyết(Hypothesis) | Giả thiết (Assumption) |
Cần được kiểm chứng tính đúng/ sai
Chưa được sử dụng |
Được coi là đúng
Sử dụng để suy ra điều gì đó |
Giả thuyết thống kê
Tham số của biến ngẫu nhiên X/ tổng thể: \(\mu, \sigma^2, p\).
Phi tham số: dạng phân phối, tính chất của X.
Kiểm định giả thuyết
Kiểm chứng tính đúng sai của các giả thuyết
Cặp giả thuyết
\(\begin{cases}H_0: \text{giả thuyết gốc } (\text{null hypothesis})\\
H_1: \text{giả thuyết đối } (\text{alternative hypothesis})\\
\end{cases}\)
Kiểm định tham số θ chưa biết, so sánh với \(\theta_0\), có 3 dạng:
\(\begin{cases}H_0: \theta = \theta_0 (\theta \le \theta_0)\\
H_1: \theta \gt \theta_0
\end{cases}\) \(\begin{cases}
H_0: \theta = \theta_0 (\theta \ge \theta_0)\\
H_1: \theta \lt \theta_0
\end{cases}\) \(\begin{cases}
H_0: \theta = \theta_0 \\
H_1: \theta\neq \theta_0
\end{cases}\)
\(\theta_0\) là 1 số biết trước => 1 tham số.
\(\theta_0\) là chưa biết trước => 2 tham số.
Quyết định về H0 là các sai lầm
\(H_0\) đúng | \(H_0\) sai | |
Bác bỏ \(H_0\) | Sai lầm loại 1. Xác suất α | Quyết định đúng. xác suất (1 – β) |
Chấp nhận \(H_0\) | Quyết định đúng. Xác suất (1- α) | Sai lầm loại 2. Xác suất β |
II. Công thức kiểm định giả thuyết thống kê
Xét bài toán kiểm định \(\mu\) với số \(\mu_0\) biết trước:
III. Bài tập kiểm định giả thuyết thống kê có lời giải
Ví dụ 1: Điều tra chi tiêu hàng năm của 25 công nhân khu công nghiệp A thấy trung bình là 39 triệu đồng và độ lệch chuẩn là 3,5 triệu đồng. Giả thiết chi tiêu của công nhân là biến ngẫu nhiên phân phối chuẩn.
a) Có thể cho rằng chi tiêu của công nhân khu A là 40 triệu đồng?
b) Điều tra 30 công nhân khu B thấy độ lệch chuẩn là 4 triệu đồng. Có thể cho rằng chi tiêu công nhân khu B phân tán hơn khu A không?
Giải
Ví dụ 2: Trọng lượng thiết kế của một gói sữa trên dây chuyền tự động là 80gam. Người ta cân 40 gói sữa đã được sản xuất thì thu được trung bình là 79,8 gam và độ lệch chuẩn là 2.5gam. Có thể cho rằng sữa không bị đóng thiếu so với quy định
Giải
Ví dụ 3: Trường X tuyển các thí sinh có năng lực học tập phù hợp, giả sử năng lực học tập được đo bởi tham số 0 và 0 ≥ 8 được cho là phù hợp. Công việc tuyển sinh được xem như kiểm định giả thuyết về năng lực học tập của thí sinh.
Giải
IV. Bài tập kiểm định thống kê
Bài tập 1: Điều tra chi tiêu hàng năm của 25 công nhân khu công nghiệp A thấy trung bình là 39 triệu đồng và độ lệch chuẩn là 3,5 triệu đồng. Giả thiết chi tiêu của công nhân là biến ngẫu nhiên phân phối chuẩn.
a) Có thể cho rằng chi tiêu của công nhân khu A là 40 triệu đồng? a = 5%
c) Tính p-value của kiểm định ở ý a) và xác suất mắc sai lầm loại 2 khi chi tiêu trung bình là 42 triệu đồng.
Giải
Bài tập 2: Điều tra chi tiêu hàng năm của 40 công nhân khu công nghiệp A thấy trung bình mẫu là 34 triệu đồng và độ lệch chuẩn mẫu là 5,8 triệu đồng. Điều tra công nhân tại khu công nghiệp B thì chi tiêu trung bình là 35 triệu đồng và độ lệch chuẩn là 5 triệu đồng.
Với mức ý nghĩa 5%, có thể cho rằng chỉ tiêu trung bình của công nhân khu công nghiệp A và B là như nhau không?
Tính p-value của kiểm định và cho biết kết luận thu được có thể mắc phải sai lầm loại mấy? Giả thiết chi tiêu công nhân là biến ngẫu nhiên phân phối chuẩn.
Giải
V. Bài toán kiểm định giả thuyết thống kê
Bài tập 3: Điều tra chi tiêu hàng năm của 40 công nhân khu công nghiệp A thấy trung bình mẫu là 34 triệu đồng và độ
lệch chuẩn mẫu là 5,8 triệu đồng. Điều tra công nhân tại khu công nghiệp B thì chỉ tiêu trung bình là 35 triệu đồng và
độ lệch chuẩn là 5 triệu đồng. Giả thiết chi tiêu công nhân là biến ngẫu nhiên phân phối chuẩn.
Với mức ý nghĩa 5%, có thể cho rằng chi tiêu của công nhân khu công nghiệp B đồng đều hơn ở khu công nghiệp A
không?
Giải
Bài tập 4: Quảng cáo của một công ty cho rằng tỷ lệ phế phẩm của công ty trên thị trường tối đa là 12%. Kiểm tra 400
sản phẩm của công ty trên thị trường thì có 60 phế phẩm.
Với mức ý nghĩa 5% có thể cho rằng quảng cáo của công ty là đúng không?
Giải
Trên đây là công thức, lý thuyết về kiểm định giả thuyết trong môn xác suất thống kê. Cảm ơn các bạn đã theo dõi trên ttnguyen.net.