Bài 2. Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm

Chương III. CÁC SỐ ĐẶC TRƯNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU GHÉP NHÓM

1. Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm

Giá trị đại diện của nhóm [a; b) là ${\color{Blue}c=\frac{1}{2}(a+b)}$. Xét mẫu số liệu ghép nhóm cho bởi bảng sau:

Nhóm [u1; u2) [u2; u3)   ...   [uk; uk+1)
Giá trị đại diện c1 c2 ... ck
Tần số n1 n2 ... nk

Phương sai của mẫu số liệu ghép nhóm, kí hiệu S2 , được tính bởi công thức

$S^2=\frac{1}{n}\left[n_1(c_1-\overline{x})^2+n_2(c_2-\overline{x})^2+...+n_k(c_k-\overline{x})^2\right]$

trong đó:

n = n1 + n2 + ... + nk là cỡ mẫu;

$\overline{x}=\frac{1}{n}(n_1c_1+n_2c_2+...+n_kc_k)$ là số trung bình.

Độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu S, là căn bậc hai số học của phương sai, nghĩa là

$S=\sqrt{S^2}$.

Chú ý:

a) Phương sai của mẫu số liệu ghép nhóm có thể được tính theo công thức sau:

$S^2=\frac{1}{n}\left(n_1c_1^{2}+n_2c_2^{2}+...+n_kc_k^{2}\right)-\overline{x}^2$.

b) Trong thống kê, người ta còn dùng đại lượng sau để đo mức độ phân tán của mẫu số liệu ghép nhóm:

$\widehat{s}^2=\frac{1}{n-1}\left[n_1(c_1-\overline{x})^2+n_2(c_2-\overline{x})^2+...+n_k(c_k-\overline{x})^2\right]$.

Ý nghĩa của phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm

• Phương sai (độ lệch chuẩn) của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho phương sai (độ lệch chuẩn) của mẫu số liệu gốc. Chúng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm xung quanh số trung bình của mẫu số liệu. Phương sai và độ lệch chuẩn càng lớn thì dữ liệu càng phân tán.

• Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.

Chú ý: Với các mẫu số liệu ghép nhóm có cùng số trung bình (hoặc xấp xỉ nhau), ta thường sử dụng phương sai và độ lệch chuẩn để so sánh mức độ phân tán của các mẫu số liệu đó.

Ví dụ

Mai sử dụng vòng đeo tay thông minh để ghi lại số bước chân bạn đi mỗi ngày trong một tháng. Kết quả được ghi lại ở bảng sau:

Số bước (đơn vị: nghìn) [3; 5) [5; 7) [7; 9) [9; 11) [11; 13)
Số ngày 6 7 6 6 5

Hãy tính số trung bình và độ lệch chuẩn của mẫu số liệu ghép nhóm trên.

Giải

Số bước đại diện (đơn vị: nghìn) 4 6 8 10 12
Số ngày 6 7 6 6 5

Cỡ mẫu là n = 6 + 7 + 6 + 6 + 5 = 30.

Số trung bình của mẫu số liệu ghép nhóm là:

$\overline{x}=\frac{1}{30}$.(6⋅4 + 7⋅6 + 6⋅8 + 6⋅10 + 5⋅12) = 7,8.

Phương sai của mẫu số liệu ghép nhóm là:

S2 = $\frac{1}{30}$.(6∙ 42 + 7∙ 62 + 6∙ 82 + 6∙ 102 + 5∙ 122) – (7,8)2 = 7,56.

Độ lệch chuẩn của mẫu số liệu ghép nhóm là:

S = $\sqrt{7,56}$ = 2,75.


Xem thêm các bài học khác :

Chương III. CÁC SỐ ĐẶC TRƯNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU GHÉP NHÓM

Bài 1. Khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm
Bài 2. Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm