Sai số chuẩn (SE) là thước đo độ chính xác của trung bình mẫu như là ước lượng của trung bình tổng thể. Sai số chuẩn càng nhỏ, trung bình ước lượng càng chính xác.
Công thức sai số chuẩn
SE = s / √n
trong đó:
- s = độ lệch chuẩn của mẫu
- n = cỡ mẫu
- √n = căn bậc hai của cỡ mẫu
Ví dụ đã giải: 25 bệnh nhân
Tình huống: Nghiên cứu y tế với 25 bệnh nhân (n = 25), nhịp tim trung bình x̄ = 72 nhịp/phút, độ lệch chuẩn s = 10 nhịp/phút.
Bước 1: Áp dụng công thức sai số chuẩn
SE = s / √n = 10 / √25 = 10 / 5 = 2 nhịp/phút
Diễn giải: Sai số chuẩn 2 nhịp/phút có nghĩa là trung bình mẫu của chúng ta (72 nhịp/phút) được kỳ vọng nằm trong ±2 nhịp/phút so với trung bình thực sự của tổng thể.
Tính khoảng tin cậy 95%
Biết sai số chuẩn, chúng ta có thể xây dựng khoảng tin cậy 95%:
95% CI = x̄ ± 1.96 × SE
Áp dụng vào ví dụ:
72 ± 1.96 × 2 = 72 ± 3.92
95% CI: từ 68.08 đến 75.92 nhịp/phút
Điều này có nghĩa: Chúng ta tự tin 95% rằng nhịp tim trung bình thực sự của tổng thể nằm trong khoảng 68.08 đến 75.92 nhịp/phút.
So sánh độ lệch chuẩn và sai số chuẩn
| Tiêu chí | Độ lệch chuẩn (SD) | Sai số chuẩn (SE) |
|---|---|---|
| Đo gì | Sự phân tán của các giá trị riêng lẻ | Độ chính xác của trung bình ước lượng |
| Ảnh hưởng của cỡ mẫu | Không thay đổi nhiều | Giảm khi cỡ mẫu tăng |
| Sử dụng thông thường | Mô tả dữ liệu và tính biến động | Suy diễn và ước lượng thống kê |
Ảnh hưởng thiết yếu của cỡ mẫu
Tăng cỡ mẫu cải thiện đáng kể độ chính xác của ước lượng:
- Tăng gấp đôi n giảm SE đi √2 lần (khoảng 29%)
- Tăng gấp bốn n giảm SE xuống một nửa chính xác
Mối quan hệ này là lý do tại sao các nhà nghiên cứu tăng cỡ mẫu của họ để đạt được độ chính xác cao hơn.
Khi nào dùng SD, khi nào dùng SE
- Dùng SD khi mô tả tính biến động trong một nhóm và khi so sánh các nhóm.
- Dùng SE khi báo cáo độ chính xác của trung bình, khi xây dựng khoảng tin cậy và khi thực hiện các kiểm định thống kê.