Trong bài viết này, TTnguyen sẽ cùng bạn tìm hiểu về khái niệm và lấy ví dụ tổng thể và mẫu trong xác suất thống kê. Chúng ta sẽ tìm hiểu cách thu thập mẫu một cách hiệu quả, các phương pháp phân tích dữ liệu mẫu, và cách chúng ta có thể sử dụng thông tin từ mẫu để suy luận về tổng thể.
Xem thêm:
I. Tổng thể nghiên cứu
Tổng thể nghiên cứu là tập hợp tất cả các đối tượng hoặc phần tử mà chúng ta muốn nghiên cứu hoặc rút ra kết luận.
- Dấu hiệu nghiên cứu: Tổng thể được đặc trưng bởi một hoặc nhiều dấu hiệu cụ thể, chẳng hạn như chiều cao, thu nhập, hay số lượng sản phẩm bị lỗi.
- Kích thước tổng thể: Ký hiệu là N, có thể là hữu hạn hoặc vô hạn.
- Ví dụ về tổng thể nghiên cứu:
- Tất cả các sinh viên trong một trường đại học.
- Tất cả các hộ gia đình trong một thành phố.
Các tham số đặc trưng của tổng thể:
Tham số/ ký hiệu | Công thức tính với N |
Trung bình: \(m,\mu\) | \(m=\frac{1}{N}\sum_{i=1}^{N}x_{i}\) |
Phương sai: \(\sigma^{2}\) | \(\sigma^{2}=\frac{1}{N}\sum_{i=1}^{N}(x_{i}-m)^{2}\) |
Độ lệch chuẩn: \(\sigma\) | \(\sigma=\sqrt{\sigma^{2}}\) |
Tần suất/ tỷ lệ/ Xác suất: P(A) = p | \(p=\frac{M_{A}}{N}\) |
II. Mẫu và thống kê mẫu
Mẫu là tập hợp con được chọn ra từ tổng thể để nghiên cứu. Mẫu thường được sử dụng khi việc khảo sát toàn bộ tổng thể là không khả thi.
- Kích thước mẫu: Ký hiệu là n.
- Ví dụ về tổng thể và mẫu:
- Tổng thể: Tất cả học sinh trong một trường.
- Mẫu: 100 học sinh được chọn ngẫu nhiên từ trường đó để khảo sát.
Biến X đo lường miêu tả cho dấu hiệu nghiên cứu.
- Mẫu ngẫu nhiên: \(X_{1}, X_{2}, X_{3}, …, X_{n}\)
- Mẫu cụ thể: \(x_{1}, x_{2}, x_{3}, …, x_{n}\)
- Thống kê mẫu: \(g = g(x_{1}, x_{2}, x_{3}, …, x_{n})\)
Các thống kê đặc trưng của mẫu:
Thống kê: ký hiệu | Công thức tính toán |
Trung bình: \(\bar{x}\) | \(\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}\) |
Mốt:\(x_{0}. mod(X), x_{m}\) | Xuất hiện nhiều nhất trong mẫu |
Trung vị: \(x_{d},med(X)\) | Chia mẫu thành 2 nửa bằng nhau về số lượng |
Sai lệch trung bình: ms(Phương sai mẫu không điều chỉnh) | \(ms=\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}\) |
Phương sai: \(s^{2}\)
(Phương sai mẫu có điều chỉnh) Hệ số điều chỉnh là n/(n-1) |
\(s^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}\) |
Độ lệch chuẩn: s
(Độ lệch chuẩn mẫu có điều chỉnh) |
\(s=\sqrt{s^{2}}\) |
Tần suất/ tỷ lệ: \(f(A) = f = \hat{p}\) | \(\hat{p}=\frac{m_{A}}{n}\) |
Phương pháp mô tả tổng thể:
- Liệt kê giá trị
- Quy luật phân phối xác suất
- Đồ thị
Phương pháp mẫu:
Phương pháp mẫu là phương pháp: Từ tổng thể ta lấy ra một số phần tử đại diện cho tổng thể, số phần tử lấy ra gọi là kích thước mẫu và ký hiệu là n trên cơ sở phân tích số liệu mẫu mà ta đưa ra các kết luận (hay suy đoán) về tổng thể.
Phương pháp mẫu bao gồm các bước sau :
Bước 1 : Từ tổng thể lấy ra một mẫu có kích thước n
Bước 2 : Xác định các tham số đặc trưng mẫu, hay còn gọi là các thống kê mẫu
Bước 3 : Xác định quy luật phân phối xác suất cho các thống kê mẫu
Bước 4 : Xuất phất từ các thống kê mẫu ta đưa ra kết luận về các tham số của tổng thể
III. Phân biệt tổng thể và mẫu
Tổng thể | Mẫu |
Là tập hợp tất cả các phần tử liên quan đến nghiên cứu. | Là một phần nhỏ của tổng thể được chọn ra để nghiên cứu. |
Có thể có kích thước lớn hoặc vô hạn. | Kích thước nhỏ hơn tổng thể và hữu hạn. |
Phân tích tổng thể thường khó khăn và tốn kém. | Phân tích mẫu đơn giản, tiết kiệm thời gian và chi phí. |
IV. Bài tập tổng thể và mẫu
Bài 1: Phỏng vấn ngẫu nhiên 6 sinh viên trong một lớp học về chiều cao (cm):
Ngẫu nhiên: \(X_{1}, X_{2}, X_{3}, X_{4}, X_{5}, X_{6}\)
Cụ thể: 160; 161; 162; 161; 160; 161
Liệt kê: 160; 161; 162; 161; 160; 161
Giải
Phân nhóm:
\(x_{i}\) | 160 | 161 | 162 |
\(n_{i}\) | 2 | 3 | 1 |
Trung bình:
\(\bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_{i}\) \(\bar{x} = \frac{160+161+162+161+160+161}{6}=160,833\)Trung vị:
Vì mẫu đang chẵn nên ta bổ sung thêm 1 quan sát để thành mẫu lẻ và sắp xếp tăng dần:
160; 160; 161; 161; 161;162; 180
n lẻ: \(x_{d} = x_{\frac{n+1}{2}} = x_{\frac{7+1}{2}} = x_{4} = 161\)
n chẵn: 160; 160; 161; 161; 161;162
\(x_{d} = \frac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2} = \frac{x_{3}+x_{4}}{2} = 161\)Mốt(xuất hiện nhiều nhất):
\(x_{0} = Mod(X)= x_{i} | Max(n_{i}) = 161\)Phương sai:
\(s^{2}= \frac{n}{n-1}[\bar{x^{2}} – (\bar{x})^{2}]\)\(\bar{x^{2}}\): Trung bình của các bình phương x.
\(\bar{x}\): Trung bình mẫu.
\(\bar{x^{2}} = \frac{2.160^{2} + 3.161^{2} + 1.162^{2}}{6}= 25867,833\) \(s^{2}= \frac{n}{n-1}[\bar{x^{2}} – (\bar{x})^{2}]= \frac{6}{5}=(25867,833-160,833^{2})= 0,6949\)Độ lệch chuẩn s = 0,834
Hệ số biến thiên:
\(cv = \left| \frac{s}{\bar{x}} \right|.100\% = \frac{0,834}{160,833}.100\%= 0,52\%\)Tỷ lệ sinh viên cao từ 161 cm trở lên:
\(\hat{p}=\frac{3+1}{6} = \frac{2}{3}\)Tính trung bình và độ lệch chuẩn của mẫu được gộp từ 2 mẫu
\(W_1=\left\{ {x_1, i=\overline{1,n_1}} \right\} n_1, \overline{x_1}, s_1\) \(W_2=\left\{ {x_2, i=\overline{2,n_2}} \right\} n_2, \overline{x_2}, s_2\) \(W=\left\{ w_1, w_2 \right\} n,\bar{x},s?\)Giải
\( n = n_1 + n_2\) \(\overline{x} = \frac{n_1x_1 + n_2x_2}{n_1 + n_2}= \frac{1}{n}\sum_{k=1}^{n}x_k=\frac{1}{n_1+n_2}\left( n_1\frac{1}{n_1}\sum_{i=1}^{n_1}x_{1i} + n_2\sum_{j=2}^{n_2}x_{2j}\right)\) \(s^2=\frac{n}{n-1}\left[ \overline{x^2}-(\overline{x})^2 \right]\) \(\overline{x^2}=\frac{n_1\overline{x_1^2} + n_2\overline{x_2^2}}{n_1+n_2}=\frac{1}{n}\left[ (n_1-1)s_1^2 + n_1(\overline{x_1})^2 + (n_2-1)s_2^2+ n_2(\overline{x_2})^2\right]\)Ví dụ: Theo số điều tra mức sống dân cư năm 2014 thì Tổng cục Thống kê đã khảo sát 420 hộ gia đình ở Hà Nội trong đó có 183 hộ ở thành thị và 237 hộ ở nông thôn. Thu thập trung bình và độ lệch chuẩn mẫu của các hộ gia đình tương ứng là 11,8 triệu đồng/ tháng và 9,16 triệu đồng/ tháng. Chi tiêu trung bình và độ lệch chuẩn mẫu của các hộ gia đình tương ứng là 8,58 triệu đồng/ tháng và 6,58 triệu đồng/ tháng. Giả thiết thu nhập và chi tiêu của các hộ gia đình ở Hà Nội là các biến ngẫu nhiên có phân phối chuẩn. Với mức ý nghĩa α = 5%
Lời giải
Bài viết cùng chủ đề:
giải bài tập xác suất thống kê chương 2