Bài 1. Thu thập và phân loại dữ liệu

Chương 4. MỘT SỐ YẾU TỐ THỐNG KÊ

Theo Tổng cục Môi Trường. Việt Nam có khu hệ chim phong phú và đa dạng, với tổng số loài chim ghi nhận là 888 loài, trong đó có 72 loài chim hiện đang bị đe dọa tuyệt chủng ở mức độ toàn cầu, 51 loài ít xuất hiện và hiếm gặp. (Theo Tạp chí Môi Trường 4/2017)

Theo em, việc thu thập các thông tin ở trên đã giúp ích gì trong việc bảo tồn các loài chim?

1. Thu thập dữ liệu

Những thông tin thu thập được như: số, chữ, hình ảnh, ... được gọi là dữ liệuDữ liệu dưới dạng số được gọi là số liệu.

Có nhiều cách để thu thập dữ liệu như quan sát, lập phiếu điều tra (phiếu hỏi), ... hoặc thu thập từ những nguồn có sẵn như sách, báo, trang web, ...

Ví dụ

Nhà bạn Mai mở tiệm kem, bạn ấy muốn tìm hiểu về các loại kem yêu thích của 30 khách hàng trong sáng Chủ nhật và thu được kết quả như sau:

Các loại kem được yêu thích

Loại kem Kiểm đếm
Dâu
Nho
Sầu riêng
Sô cô la
Va ni

 

Từ bảng kiểm đếm của bạn Mai, em hãy cho biết:

- Mai đang điều tra về vấn đề gì?

- Hãy chỉ ra các dữ liệu mà bạn ấy thu thập được trong bảng.

Giải

• Mai đang điều tra về vấn đề: các loại kem yêu thích của 30 khách hàng trong sáng Chủ nhật.

• Các dữ liệu thu thập được trong bảng: có 5 loại kem được yêu thích: dâu (11 người thích), nho (4 người thích), sầu riêng (8 người thích), sô cô la (5 người thích), vani (2 người thích).

2. Phân loại dữ liệu

Thông tin rất đa dạng và phong phú. Việc sắp xếp thông tin theo những tiêu chí nhất định gọi là phân loại dữ liệu.

Ví dụ

Quan sát bảng điều tra số lượng con vật nuôi ở nhà của học sinh tổ 4 lớp 6A dưới đây.

Tên Các con vật nuôi Tổng số con vật
Mai 1 chó, 5 cá 6
Lan 2 chó, 2 mèo 4
Cúc 0 0
Trúc 1 chó, 1 mèo 2
Yến 1 mèo, 1 chim 2
Hùng 0 0
Cường 4 chim, 4 cá 8
Thanh 8 cá, 2 mèo 10

a) Em hãy cho biết:

- Có bao nhiêu học sinh không nuôi con vật nào?

- Có bao nhiêu loại con vật được nuôi?

b) Hãy hoàn thành việc phân loại dữ liệu trong bảng điều tra theo gợi ý như sau:

Có nuôi con vật hay không Số bạn
Có nuôi ...
Không nuôi ...

Giải

a) Dựa vào bảng số liệu, ta có:

- Có 2 bạn (Cúc và Hùng) không nuôi con vật nào.

- Có 4 loại con vật được nuôi (chó, mèo, cá, chim).

b) 

Có nuôi con vật hay không Số bạn
Có nuôi 6
Không nuôi 2

3. Tính hợp lí của dữ liệu

Để đánh giá tính hợp lí của dữ liệu, ta cần đưa ra các tiêu chí đánh giá, chẳng hạn như dữ liệu phải:

• Đúng định dạng.

• Nằm trong phạm vi dự kiến.

Ví dụ

Tìm điểm không hợp lý trong các bảng dữ liệu sau:

a) Danh sách email của các bạn tổ 1 lớp 6C.

STT Tên Email
1 Tổ trưởng conan@.gmail.com
2 Nguyễn Thị Mai Mai08@yahoo.com
3 Trần Công Hùng hungtc@hotmail.com
4 Lê Thị Bạch Cúc 12/8 Trần Hưng Đạo
5 Đặng Thị Dung dungdt@gmail.com
6 Lê Bảo Châu chauchau@gmail.com
7 Lý Thị Đào Dao09.com
8 Đinh Công 12 dcmuoihai@outlook.com

b) Thân nhiệt (độ C) của bệnh nhân A trong 10 tiếng theo dõi được ghi lại trong bảng sau:

39 39 40 41 38
38 37 0 100 -2

Giải

a) Những điểm không hợp lý:

• Ở cột Tên: Tổ trưởng, Đinh Công 12.

• Ở cột Email (không đúng định dạng): conan@.gmail.com; 12/8 Trần Hưng Đạo; Dao09.com

b) Thông thường thân nhiệt người có phạm vi khoảng từ 36 °C đến 43 °C. Do đó, bệnh nhân A không thể có thân nhiệt là 0 °C; 100 °C; -2 °C.


Xem thêm các bài học khác :

Chương 4. MỘT SỐ YẾU TỐ THỐNG KÊ

Bài 1. Thu thập và phân loại dữ liệu
Bài 2. Biểu diễn dữ liệu trên bảng
Bài 3. Biểu đồ tranh
Bài 4. Biểu đồ cột - Biểu đồ cột kép
Ôn tập chương 4. Một số yếu tố thống kê