Bài 3. Các số đặc trưng đo xu thế trung tâm của mẫu số liệu

Chương 6. Thống kê

1. Số trung bình

• Giả sử ta có một mẫu số liệu là x1, x2, … , xn.

Số trung bình (hay số trung bình cộng) của mẫu số liệu này, kí hiệu là ${\color{Blue}\overline{x}}$, được tính bởi công thức:

$\overline{x}=\frac{x_1+x_2+…+x_n}{n}$

• Giả sử mẫu số liệu được cho dưới dạng bảng tần số:

Giá trị x1 x2 xk
Tần số n1 n2 nk

Khi đó, công thức tính số trung bình là:

$\overline{x}=\frac{n_1x_1+n_2x_2+…+n_kx_k}{n}$

trong đó n = n1 + n2 + … + nk. Ta gọi ncỡ mẫu.

Chú ý: Nếu kí hiệu $f_k=\frac{n_k}{n}$ là tần số tương đối (hay tần suất) của xk trong mẫu số liệu thì công thức tính số trung bình là:

$\overline{x}=f_1x_1+f_2x_2+…+f_kx_k$.

Ý nghĩaSố trung bình của mẫu số liệu được dùng làm đại diện cho các số liệu trong mẫu.

Ví dụ

Số bàn thắng mà một đội bóng ghi được ở mỗi trận đấu trong một mùa giải được thống kê lại ở bảng sau:

Số bàn thắng 0 1 2 3 4 6
Số trận 5 10 5 3 2 1

Hãy xác định số bàn thắng trung bình đội đó ghi được trong một trận đấu của mùa giải.

Giải

Số trận đấu của mùa giải (cỡ mẫu) là:

n = 5 + 10 + 5 + 3 + 2 + 1 = 26 (trận).

Vậy số bàn thắng trung bình của đội đó ghi được trong một trận đấu của mùa giải là:

$\frac{5.0+10.1+5.2+3.3+2.4+1.6}{26}$ ≈ 1,65 (bàn thắng).

2. Trung vị và tứ phân vị

Sắp xếp mẫu số liệu theo thứ tự không giảm, ta được:

x1 ≤ x2 ≤ … ≤ xn.

Trung vị của mẫu, kí hiệu là Me, là giá trị ở chính giữa dãy x1, x2, … , xn. Cụ thể:

• Nếu n = 2k + 1, k ∈ ℕ (hay cỡ mẫu n lẻ) thì trung vị của mẫu ${\color{Blue}M_e=x_{k+1}}$.

• Nếu n = 2k, k ∈ ℕ (hay cỡ mẫu n chẵn) thì trung vị của mẫu ${\color{Blue}M_e=\frac{1}{2}(x_k+x_{k+1})}$.

Ý nghĩa:

Trung vị Me là giá trị nằm ở chính giữa của mẫu số liệu theo nghĩa: luôn có ít nhất 50% số liệu trong mẫu lớn hơn hoặc bằng Me và ít nhất 50% số liệu trong mẫu nhỏ hơn hoặc bằng Me.

• Khi trong mẫu xuất hiện thêm một giá trị rất lớn hoặc rất nhỏ thì số trung bình sẽ bị thay đổi đáng kể nhưng trung vị thì ít bị thay đổi.

Tứ phân vị của một mẫu số liệu gồm ba giá trị, gọi là tứ phân vị thứ nhất, thứ hai và thứ ba (lần lượt kí hiệu là Q1, Q2, Q3). Ba giá trị này chia mẫu số liệu đã sắp xếp thành bốn phần đều nhau. Cụ thể:

• Q2 chính là số trung vị Me của mẫu.

• Q1 là trung vị của nửa mẫu số liệu đã sắp xếp bên trái Q2 (không bao gồm Q2 nếu n lẻ).

• Q3 là trung vị của nửa mẫu số liệu đã sắp xếp bên phải Q2 (không bao gồm Q2 nếu n lẻ).

Ý nghĩa:

Các điểm tứ phân vị Q1, Q2, Q3 chia mẫu số liệu đã sắp xếp thành bốn phần, mỗi phần chứa khoảng 25% tổng số  số liệu.

Q1 còn gọi là tứ phân vị dướiđại diện cho nửa mẫu số liệu phía dướiQ3 còn gọi là tứ phân vị trên và đại diện cho nửa mẫu số liệu phía trên.

tu-phan-vi-cua-mau-so-lieu-da-sap-xep

Ví dụ

1) Thời gian chạy 100 mét (đơn vị: giây) của các bạn học sinh ở hai nhóm A và B được ghi lại ở bảng sau:

Nhóm A 12,2 13,5 12,7 13,1 12,5 12,9 13,2 12,8
Nhóm B 12,1 13,4 13,2 12,9 13,7      

Hãy tìm trung vị của các số liệu ở bảng trên.

Giải

• Sắp xếp các số liệu ở nhóm A theo thứ tự không giảm, ta được dãy:

12,2; 12,5; 12,7; 12,8; 12,9; 13,1; 13,2; 13,5

Vì cỡ mẫu là 8 (số chẵn) nên Me của nhóm A là trung bình cộng của số liệu thứ 4 và thứ 5 của dãy,

Me = $\frac{1}{2}$.(12,8 + 12,9) = 12,85.

• Sắp xếp các số liệu ở nhóm B theo thứ tự không giảm, ta được dãy:

12,1; 12,9; 13,2; 13,4; 13,7

Vì cỡ mẫu là 5 (số lẻ) nên Me của nhóm B là số liệu thứ 3 của dãy, Me = 13,2.

 

2) Hãy tìm tứ phân vị của các mẫu số liệu sau:

a) 10; 13; 15; 2; 10; 19; 2; 5; 7.

b) 15; 19; 10; 5; 9; 10; 1; 2; 5; 15.

Giải

a) Sắp xếp mẫu theo thứ tự không giảm, ta được:

2; 2; 5; 7; 10; 10; 13; 15; 19.

• Vì cỡ mẫu n = 9 (số lẻ) nên Q2 là số liệu thứ 5 của dãy, Q2 = 10.

• Q1 là trung vị của mẫu: 2; 2; 5; 7. Do đó, Q1 = $\frac{1}{2}$.(2 + 5) = 3,5.

• Q3 là trung vị của mẫu: 10; 13; 15; 19. Do đó, Q3 = $\frac{1}{2}$.(13 + 15) = 14.

b) Sắp xếp mẫu theo thứ tự không giảm, ta được:

1; 2; 5; 5; 9; 10; 10; 15; 15; 19.

• Vì cỡ mẫu n = 10 (số chẵn) nên Q2 = $\frac{1}{2}$.(9 + 10) = 9,5.

• Q1 là trung vị của mẫu: 1; 2; 5; 5; 9. Do đó, Q1 = 5.

• Q3 là trung vị của mẫu: 10; 10; 15; 15; 19. Do đó, Q3 = 15.

3. Mốt

Cho một mẫu số liệu dưới dạng bảng tần số. Giá trị có tần số lớn nhất được gọi là mốt của mẫu số liệu và kí hiệu là Mo.

Ý nghĩa: Mốt đặc trưng cho giá trị xuất hiện nhiều nhất trong mẫu.

Chú ý: Một mẫu số liệu có thể có nhiều mốt. Khi tất cả các giá trị trong mẫu số liệu có tần số xuất hiện bằng nhau thì mẫu số liệu đó không có mốt.

Ví dụ

Điểm số bài kiểm tra môn Toán của các bạn trong Tổ 1 là 6; 10; 6; 8; 7; 10. Hãy tìm mốt của số liệu điểm kiểm tra của các bạn Tổ 1.

Giải

Bảng tần số:

Điểm 6 7 8 10
Số lần 2 1 1 2

Vậy mốt của số liệu điểm kiểm tra trên là 610.


Xem thêm các bài học khác :

Chương 6. Thống kê

Bài 1. Số gần đúng và sai số
Bài 2. Mô tả và biểu diễn dữ liệu trên các bảng và biểu đồ
Bài 3. Các số đặc trưng đo xu thế trung tâm của mẫu số liệu
Bài 4. Các số đặc trưng đo mức độ phân tán của mẫu số liệu
Ôn tập chương 6. Thống kê