Sai số chuẩn của trung bình mẫu năm 2024

Nếu chúng ta chọn mẫu N lần, mỗi lần với n đối tượng thì chúng ta sẽ có N số trung bình. Độ lệch chuẩn của N số trung bình này chính là sai số chuẩn. Lưu ý, N ở đây là hàng triệu hay tỉ lần. Do đó, sai số chuẩn phản ảnh độ dao động hay biến thiên của các số trung bình mẫu [sample averages].

Tuy nhiên, không có cái gọi là “standard error of the mean”, mà chỉ có “standard deviation of the means”. Chữ means có “s” là số nhiều vì tính từ nhiều số trung bình. Thay vì gọi dài dòng là standard deviation of the means, người ta gọi ngắn gọn bằng một thuật ngữ mới: standard error.

2. Ý nghĩa của độ lệch chuẩn [SD] và sai số chuẩn [SE]

Gọi thông số trung bình của một quần thể là \[\mu \] [chúng ta không biết giá trị thật của \[\mu \]]. Chúng ta có thể ước lượng gián tiếp \[\mu \] qua số trung bình của mẫu là \[{\bar x}\] và độ lệch chuẩn của mẫu là s. Theo lí thuyết xác suất của phân phối chuẩn [dựa theo độ lệch chuẩn – SD], chúng ta có thể phát biểu rằng:

  • 68% quan sát trong tổng thể đó có giá trị từ \[{\bar x}\] ─ s đến \[{\bar x}\] + s;
  • 95% quan sát trong tổng thể đó có giá trị từ \[{\bar x}\] ─ 1.96*s đến \[{\bar x}\] + 1.96*s ;
  • 99% quan sát trong tổng thể đó có giá trị từ \[{\bar x}\] ─ 3*s đến \[{\bar x}\] + 3*s.

Nếu gọi theo sai số chuẩn – SE, chúng ta có thể phát biểu rằng:

  • 68% số trung bình từ mẫu có giá trị từ \[{\bar x}\] ─ SE đến \[{\bar x}\] + SE;
  • 95% số trung bình từ mẫu có giá trị từ \[{\bar x}\] ─ 1.96*SE đến \[{\bar x}\] + 1.96*SE ;
  • 99% số trung bình từ mẫu có giá trị từ \[{\bar x}\] ─ 3*SE đến \[{\bar x}\] + 3*SE.

KẾT LUẬN VỀ ĐỘ LỆCH CHUẨN vs SAI SỐ CHUẨN

  • Độ lệch chuẩn – SD phản ánh độ biến thiên của các quan sát trong một tổng thể.
  • Sai số chuẩn – SE phản ánh độ dao động của các số trung bình mẫu được chọn từ tổng thể.
  • Sai số chuẩn – SE không cung cấp thông tin về độ biến thiên của một tổng thể mà chỉ mô tả dự dao động của các số trung bình mẫu.
  • Sai số chuẩn – SE thấp hơn độ lệch chuẩn, bởi vì nó chính bằng độ lệch chuẩn chia cho căn bậc 2 của cở mẫu.

Bài viết này được tổng hợp từ bài viết “Độ lệch chuẩn hay sai số chuẩn?” của Nguyễn Văn Tuấn trong chuyên đề Lâm sàng thống kê tại: ykhoa.net

Bài này sẽ bàn về giá trị sai số chuẩn standard error của hệ số hồi quy, đồng thời giới thiệu cách tính thủ công giá trị t value trong phương trình hồi quy nhé.

Từ file số liệu để chạy hồi quy ở đây phantichspss.com/filefordownload/standard-error-t-value.sav, chạy hồi quy với biến phụ thuộc là HAILONG, biến độc lập là 2 biến còn lại ra sẽ được kết quả sau:

Sai số chuẩn standard error của hệ số hồi quy là một ước tính về mức độ thay đổi của hệ số hồi quy giữa các mẫu có cùng kích thước được lấy từ cùng một tổng thể. Theo nghĩa đơn giản, nó là độ lệch chuẩn của các ước lượng hệ số của b trên nhiều mẫu. Nếu một người phải lấy nhiều mẫu có cùng cỡ mẫu từ cùng một tổng thể và sử dụng chúng để tính toán phương trình hồi quy, thì sai số chuẩn là một ước tính về hệ số hồi quy sẽ thay đổi bao nhiêu từ mẫu này sang mẫu khác. Sai số chuẩn nhỏ hơn ngụ ý dự đoán đáng tin cậy hơn và do đó khoảng tin cậy nhỏ hơn.

Ví dụ về sai số chuẩn standard errors.

Trong ảnh trên, sai số chuẩn của DAMBAO là 0.132, biểu thị rằng khoảng tin cậy 95 phần trăm cho DAMBAO sẽ là 0.542+- [1.96*0.132], hoặc nằm trong khoảng từ mức thấp nhất là 0.28 đến mức cao nhất là 0.8. Giá trị b của DAMBAO chia cho sai số chuẩn =0.542/0.132 =4.106 là giá trị t được tính toán cho kiểm định t-test [hệ số b của DAMBAO=0] [chính là giá trị trong cột t ở bảng trên].

Giá trị t của các biến trong phương trình hồi quy

Giá trị t của các biến trong phương trình, như vừa được tính toán, đo lường mức ý nghĩa thống kê của mối tương quan từng phần của biến được phản ánh qua hệ số hồi quy. Như vậy, nó chỉ ra rằng liệu nhà nghiên cứu có thể tự tin nói rằng, với một mức sai số đã nêu, rằng hệ số này không bằng 0 hay không. Giá trị F có thể được đưa ra ở giai đoạn này hơn là giá trị t. Chúng có thể so sánh trực tiếp vì giá trị t xấp xỉ căn bậc hai của giá trị F.

Giá trị t cũng đặc biệt hữu ích trong thủ tục stepwise trong việc giúp xác định xem có nên loại bỏ bất kỳ biến nào khỏi phương trình sau khi một biến độc lập khác được thêm vào hay không. Mức ý nghĩa được tính toán được so sánh với mức ngưỡng do nhà nghiên cứu đặt ra để loại bỏ biến. Khi nhiều biến được thêm vào phương trình hồi quy, mỗi biến sẽ được kiểm tra để xem liệu nó có còn nằm trong ngưỡng này hay không. Nếu nó nằm ngoài ngưỡng [mức ý nghĩa lớn hơn .10], nó sẽ bị loại khỏi phương trình hồi quy và mô hình được ước lượng lại.

Trong ví dụ trên, giá trị t [được tính bằng cách chia hệ số hồi quy cho sai số chuẩn]

\=giá trị b của DAMBAO chia cho sai số chuẩn

\=0.542/0.132 =4.106

Ccó ý nghĩa thống kê ở mức .000. Nó cung cấp cho nhà nghiên cứu một mức độ đảm bảo cao rằng hệ số này không bằng 0 và có thể được đánh giá như một yếu tố dự báo về sự hài lòng của khách hàng.

Chủ Đề