Trong bài viết này, hãy cùng TTnguyen khám phá sâu hơn về khái niệm của tổng thể và mẫu trong xác suất thống kê. Chúng ta sẽ tìm hiểu cách thu thập mẫu một cách hiệu quả, các phương pháp phân tích dữ liệu mẫu, và cách chúng ta có thể sử dụng thông tin từ mẫu để suy luận về tổng thể.
I. Tổng thể nghiên cứu
Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu nào đó được gọi là tổng thể nghiên cứu hay tổng thể.
+) Dấu hiệu nghiên được đặc trưng bởi một biến ngẫu nhiên thì biến ngẫu nhiên đó gọi là biến ngẫu nhiên gốc.
+) Số lượng các phần tử của tổng thể được gọi là kích thước của tổng thể và ký hiệu là N
+) N có thể là hữu hạn, có thể rất lớn, thậm chí là vô hạn.
II. Các tham số đặc trưng của tổng thể
Tham số/ ký hiệu | Công thức tính với N |
Trung bình: \(m,\mu\) | \(m=\frac{1}{N}\sum_{i=1}^{N}x_{i}\) |
Phương sai: \(\sigma^{2}\) | \(\sigma^{2}=\frac{1}{N}\sum_{i=1}^{N}(x_{i}-m)^{2}\) |
Độ lệch chuẩn: \(\sigma\) | \(\sigma=\sqrt{\sigma^{2}}\) |
Tần suất/ tỷ lệ/ Xác suất: P(A) = p | \(p=\frac{M_{A}}{N}\) |
III. Mẫu và thống kê mẫu
Mẫu: Tập hợp hữu hạn phân tử được lấy ra từ tổng thể.
- Kích thước: n
Biến X đo lường miêu tả cho dấu hiệu nghiên cứu.
- Mẫu ngẫu nhiên: \(X_{1}, X_{2}, X_{3}, …, X_{n}\)
- Mẫu cụ thể: \(x_{1}, x_{2}, x_{3}, …, x_{n}\)
- Thống kê mẫu: \(g = g(x_{1}, x_{2}, x_{3}, …, x_{n})\)
Thống kê: ký hiệu | Công thức tính toán |
Trung bình: \(\bar{x}\) | \(\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}\) |
Mốt:\(x_{0}. mod(X), x_{m}\) | Xuất hiện nhiều nhất trong mẫu |
Trung vị: \(x_{d},med(X)\) | Chia mẫu thành 2 nửa bằng nhau về số lượng |
Sai lệch trung bình: ms(Phương sai mẫu không điều chỉnh) | \(ms=\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}\) |
Phương sai: \(s^{2}\)
(Phương sai mẫu có điều chỉnh) Hệ số điều chỉnh là n/(n-1) |
\(s^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}\) |
Độ lệch chuẩn: s
(Độ lệch chuẩn mẫu có điều chỉnh) |
\(s=\sqrt{s^{2}}\) |
Tần suất/ tỷ lệ: \(f(A) = f = \hat{p}\) | \(\hat{p}=\frac{m_{A}}{n}\) |
IV. Phân biệt mẫu và tổng thể
- Tổng thể là tập hợp tất cả đối tượng khảo sát, trong đó, mỗi đối tượng được xem là đơn vị cấu thành nên tổng thể.
- Mẫu là tập hợp nhỏ/tập hợp con các đơn vị của tổng thể.
- Cách thức mà các nhà nghiên cứu chọn ra tập hợp con các đơn vị của tổng thể chính là chọn mẫu.
Bài tập tổng thể và mẫu
Bài 1: Phỏng vấn ngẫu nhiên 6 sinh viên trong một lớp học về chiều cao (cm):
Ngẫu nhiên: \(X_{1}, X_{2}, X_{3}, X_{4}, X_{5}, X_{6}\)
Cụ thể: 160; 161; 162; 161; 160; 161
Liệt kê: 160; 161; 162; 161; 160; 161
Giải
Phân nhóm:
\(x_{i}\) | 160 | 161 | 162 |
\(n_{i}\) | 2 | 3 | 1 |
Trung bình:
\(\bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_{i}\) \(\bar{x} = \frac{160+161+162+161+160+161}{6}=160,833\)Trung vị:
Vì mẫu đang chẵn nên ta bổ sung thêm 1 quan sát để thành mẫu lẻ và sắp xếp tăng dần:
160; 160; 161; 161; 161;162; 180
n lẻ: \(x_{d} = x_{\frac{n+1}{2}} = x_{\frac{7+1}{2}} = x_{4} = 161\)
n chẵn: 160; 160; 161; 161; 161;162
\(x_{d} = \frac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2} = \frac{x_{3}+x_{4}}{2} = 161\)Mốt(xuất hiện nhiều nhất):
\(x_{0} = Mod(X)= x_{i} | Max(n_{i}) = 161\)Phương sai:
\(s^{2}= \frac{n}{n-1}[\bar{x^{2}} – (\bar{x})^{2}]\)\(\bar{x^{2}}\): Trung bình của các bình phương x.
\(\bar{x}\): Trung bình mẫu.
\(\bar{x^{2}} = \frac{2.160^{2} + 3.161^{2} + 1.162^{2}}{6}= 25867,833\) \(s^{2}= \frac{n}{n-1}[\bar{x^{2}} – (\bar{x})^{2}]= \frac{6}{5}=(25867,833-160,833^{2})= 0,6949\)Độ lệch chuẩn s = 0,834
Hệ số biến thiên:
\(cv = \left| \frac{s}{\bar{x}} \right|.100\% = \frac{0,834}{160,833}.100\%= 0,52\%\)Tỷ lệ sinh viên cao từ 161 cm trở lên:
\(\hat{p}=\frac{3+1}{6} = \frac{2}{3}\)Tính trung bình và độ lệch chuẩn của mẫu được gộp từ 2 mẫu
\(W_1=\left\{ {x_1, i=\overline{1,n_1}} \right\} n_1, \overline{x_1}, s_1\) \(W_2=\left\{ {x_2, i=\overline{2,n_2}} \right\} n_2, \overline{x_2}, s_2\) \(W=\left\{ w_1, w_2 \right\} n,\bar{x},s?\)Giải
\( n = n_1 + n_2\) \(\overline{x} = \frac{n_1x_1 + n_2x_2}{n_1 + n_2}= \frac{1}{n}\sum_{k=1}^{n}x_k=\frac{1}{n_1+n_2}\left( n_1\frac{1}{n_1}\sum_{i=1}^{n_1}x_{1i} + n_2\sum_{j=2}^{n_2}x_{2j}\right)\) \(s^2=\frac{n}{n-1}\left[ \overline{x^2}-(\overline{x})^2 \right]\) \(\overline{x^2}=\frac{n_1\overline{x_1^2} + n_2\overline{x_2^2}}{n_1+n_2}=\frac{1}{n}\left[ (n_1-1)s_1^2 + n_1(\overline{x_1})^2 + (n_2-1)s_2^2+ n_2(\overline{x_2})^2\right]\)Ví dụ: Theo số điều tra mức sống dân cư năm 2014 thì Tổng cục Thống kê đã khảo sát 420 hộ gia đình ở Hà Nội trong đó có 183 hộ ở thành thị và 237 hộ ở nông thôn. Thu thập trung bình và độ lệch chuẩn mẫu của các hộ gia đình tương ứng là 11,8 triệu đồng/ tháng và 9,16 triệu đồng/ tháng. Chi tiêu trung bình và độ lệch chuẩn mẫu của các hộ gia đình tương ứng là 8,58 triệu đồng/ tháng và 6,58 triệu đồng/ tháng. Giả thiết thu nhập và chi tiêu của các hộ gia đình ở Hà Nội là các biến ngẫu nhiên có phân phối chuẩn. Với mức ý nghĩa α = 5%
Lời giải
Phương pháp mô tả tổng thể
- Liệt kê giá trị
- Quy luật phân phối xác suất
- Đồ thị
Phương pháp mẫu
Phương pháp mẫu là phương pháp: Từ tổng thể ta lấy ra một số phần tử đại diện cho tổng thể, số phần tử lấy ra gọi là kích thước mẫu và ký hiệu là n trên cơ sở phân tích số liệu mẫu mà ta đưa ra các kết luận (hay suy đoán) về tổng thể.
Phương pháp mẫu bao gồm các bước sau :
Bước 1 : Từ tổng thể lấy ra một mẫu có kích thước n
Bước 2 : Xác định các tham số đặc trưng mẫu, hay còn gọi là các thống kê mẫu
Bước 3 : Xác định quy luật phân phối xác suất cho các thống kê mẫu
Bước 4 : Xuất phất từ các thống kê mẫu ta đưa ra kết luận về các tham số của tổng thể.