Hướng dẫn giải bài tập kiểm định giả thuyết thống kê

Bài toán kiểm định giả thuyết thống kê

Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1. » Xem thêm

» Thu gọn

Chủ đề:

  • giả thiết thống kê
  • cách đặt thống kê
  • tiêu chuẩn kiểm định
  • kiểm định giả thiết
  • giả thiết không

Download

Xem online

Tóm tắt nội dung tài liệu

  1. Kiểm định giả thuyết thống kê Hoàng Văn Hà Ngày 6 tháng 4 năm 2012
  2. Bài toán kiểm định giả thuyết thống kê
  3. Bài toán kiểm định giả thuyết thống kê s Định nghĩa s Giả thuyết không và đối thuyết s Cách đặt giả thuyết s Miền bác bỏ - Tiêu chuẩn kiểm định s Sai lầm loại I và loại II s Bổ đề Neyman - Pearson s Kiểm định tỷ lệ hợp lý s p - giá trị Kiểm định giả thuyết thống kê Hoàng Văn Hà – 3
  4. Định nghĩa Định nghĩa 1. Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1. Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5 năm; đây là một giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ của một bo mạch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 4
  5. Giả thuyết không và đối thuyết Định nghĩa 2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được kiểm định gọi là Giả thuyết không [null hypothesis], ký hiệu là H0 . Mệnh đề đối lập với H0 gọi là đối thuyết [alternative hypothesis], ký hiệu là H1 . Xét bài toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên [X1 , . . . , Xn ] từ biến ngẫu nhiên X có hàm mật độ xác suất f [x; θ] phụ thuộc vào tham số θ. Gọi Θ là không gian tham số, và Θ0 và Θc là hai tập 0 con rời nhau của Θ sao cho Θ0 ∪ Θ0 c = Θ. Giả thuyết [giả thuyết không] và đối thuyết của bài toán có dạng như sau H0 : θ ∈ Θ0 [1] H1 : θ ∈ Θc 0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 5
  6. Giả thuyết không và đối thuyết Ví dụ 2. 1. Gọi µ là độ thay đổi trung bình trong huyết áp của một bệnh nhân sau khi dùng thuốc; bác sĩ điều trị cần quan tâm đến giả thuyết sau H0 : µ = 0 Không có ảnh hưởng của thuốc lên huyết áp của bệnh nhân H1 : µ = 0 Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân 2. Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một lô hàng mua của một nhà cung cấp. Giả sử tỷ lệ sản phấm kém tối đa được phép là 5%. Khách hàng cần quan tâm đến giả thuyết sau H0 : p ≥ 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép H1 : p < 0.05 Tỷ lệ sản phẩm kém ở mức chấp nhận được Kiểm định giả thuyết thống kê Hoàng Văn Hà – 6
  7. Cách đặt giả thuyết 1. Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa lã giả thuyết đặt ra ngược lại với điều ta muốn chứng minh, muốn thuyết phục. 2. Giả thuyết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có tác dụng trả lời bài toán thực tế đặt ra. 3. Giả thuyết được đặt ra sao cho nếu nó đúng thì ta sẽ xác định được quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làm tiểu chuẩn kiểm định. 4. Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết. Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ. "Cái đã biết" là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật. 5. Giả thuyết đặt ra thường mang ý nghĩa: "không khác nhau" hoặc "khác nhau không có ý nghĩa" hoặc "bằng nhau". Kiểm định giả thuyết thống kê Hoàng Văn Hà – 7
  8. Cách đặt giả thuyết Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một trong 3 dạng dưới đây [θ0 là giá trị kiểm định đã biết]: Hai phía: H0 : θ = θ0 H1 : θ = θ0 Một phía bên trái: H0 : θ ≥ θ0 H1 : θ < θ0 Một phía bên phải: H0 : θ ≤ θ0 H1 : θ > θ0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 8
  9. Miền bác bỏ - Tiêu chuẩn kiểm định Định nghĩa 3. Xét bài toán kiểm định giả thuyết có giả thuyết H0 và đối thuyết H1 . Giả sử rằng H0 đúng, từ mẫu ngẫu nhiên X = [X1 , . . . , Xn ] chọn hàm Z = h[X1 , . . . , Xn ; θ0 ] sao cho với số α > 0 bé tùy ý ta có thể tìm được tập hợp Wα thỏa điều kiện P [Z ∈ Wα ] = α [2] Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù Wα gọi là miền c chấp nhận giả thuyết H0 . Đại lượng ngẫu nhiên Z = h[X1 , . . . , Xn ; θ0 ] gọi là tiêu chuẩn kiểm định giả thuyết H0 . Giá trị α gọi là mức ý nghĩa của bài toán kiểm định. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 9
  10. Miền bác bỏ - Tiêu chuẩn kiểm định Thực hiện quan trắc dựa trên mẫu ngẫu nhiên [X1 , . . . , Xn ] ta thu được mẫu thực nghiệm [x1 , . . . , xn ]. Từ mẫu thực nghiệm này, ta tính được giá trị của Z là z = h[x1 , . . . , xn ; θ0 ]. s Nếu z ∈ Wα thì ta bác bỏ giả thuyết H0 . s Nếu z ∈ Wα thì ta kết luận chưa đủ cơ sở để bác bỏ H0 . c Kiểm định giả thuyết thống kê Hoàng Văn Hà – 10
  11. Sai lầm loại I và loại II Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các sai lầm sau a. Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tế giả thuyết H0 đúng. Sai lầm loại I ký hiệu là α, chính là mức ý nghĩa của kiểm định. α = P [Wα |H0 ] [3] b. Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0 trong khi thực tế H0 sai. Sai lầm loại II ký hiệu là β. c β = P [Wα |H1 ] [4] Kiểm định giả thuyết thống kê Hoàng Văn Hà – 11
  12. Sai lầm loại I và loại II XXX XXX Thực tế XXX H0 đúng H0 sai Quyết định XXX Không có sai lầm Sai lầm loại II Không bác bỏ H0 [1 − α] β Sai lầm loại I Không có sai lầm Bác bỏ H0 α [1 − β] Kiểm định giả thuyết thống kê Hoàng Văn Hà – 12
  13. Sai lầm loại I và loại II - Ví dụ Khảo sát tốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên lửa ra khỏi giàn phóng. Giả sử biến ngẫu nhiên X = tốc độ cháy của nhiên liệu [cm/s] có phân phối chuẩn với kỳ vọng µ và độ lệch chuẩn σ = 2.5. Ta cần kiểm định giả thuyết H0 : µ = 50 H1 : µ = 50 Giả sử bác bỏ H0 khi: x < 48.5 hoặc x > 51.5. Các giá trị 48.5 và 51.5 gọi là ¯ ¯ giá trị tới hạn [critical value]. Giả sử khảo sát mẫu ngẫu nhiên cỡ n = 10, ta tìm xác suất sai lầm loại I. α = P[Bác bỏ H0 khi H0 đúng] Kiểm định giả thuyết thống kê Hoàng Văn Hà – 13
  14. Sai lầm loại I và loại II - Ví dụ Tức là, ¯ ¯ α = P[X < 48.5|µ = 50] + P[X > 51.5|µ = 50] ¯ X − 50 48.5 − 50 ¯ X − 50 51.5 − 50 =P √ < √ +P √ < √ 2.5/ 10 2.5/ 10 2.5/ 10 2.5/ 10 = P[Z < −1.90] + P[Z > 1.90] = 0.0287 + 0.0287 = 0.0574 nghĩa là có 5.74% số mẫu ngẫu nhiên khảo sát được sẽ dẫn đến kết luận bác bỏ giả thuyết H0 : µ = 50 [cm/s] khi tốc độ cháy trung bình thực sự là 50 [cm/s]. Ta có thể giảm sai lầm α bằng cách mở rộng miền chấp nhận. Giả sử với cỡ mẫu n = 10, miền chấp nhận là 48 ≤ x ≤ 52, khi đó giá trị của α là ¯ 48 − 50 52 − 50 α=P Z< √ +P Z > √ 2.5/ 10 2.5/ 10 = 0.0057 + 0.0057 = 0.0114 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 14
  15. Sai lầm loại I và loại II - Ví dụ Cách thứ hai √ giảm α là tăng cỡ mẫu khảo sát, giả sử cỡ mẫu n = 16, ta có để √ σ/ n = 2.5/ 16 = 0.625, với miền bác bỏ là x < 48.5 hoặc x > 51.5, ta có ¯ ¯ ¯ ¯ α = P[X < 48.5|µ = 50] + P[X > 51.5|µ = 50] 48.5 − 50 51.5 =P Z< +P Z > 0.625 0.625 = 0.0082 + 0.0082 = 0.0164 Xác suất sai lầm loại II β được tính như sau β = P[Không bác bỏ H0 khi H0 sai] Để tính β, ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết H1 . Kiểm định giả thuyết thống kê Hoàng Văn Hà – 15
  16. Sai lầm loại I và loại II - Ví dụ Giả sử với cỡ mẫu n = 10, miền chấp nhận của giả thuyết H0 là ¯ 48.5 ≤ X ≤ 51.5 trong khi giá trị thực sự của µ = 52. Sai lầm β cho bởi ¯ β = P[48.5 ≤ X ≤ 51.5|µ = 52] 48.5 − 52 ¯ X − 52 51.5 − 52 =P √ ≤ √ ≤ √ 2.5/ 10 2.5/ 10 2.5/ 10 = P[−4.43 ≤ Z ≤ −0.63] = P[Z ≤ −0.63] − P[Z ≤ −4.43] = 0.2643 − 0.0000 = 0.2643 Giả sử giá trị thực sự µ = 50.5, khi đó ¯ β = P[48.5 ≤ X ≤ 51.5|µ = 50.5] 48.5 − 50.5 ¯ X − 50.5 51.5 − 50.5 =P √ ≤ √ ≤ √ 2.5/ 10 2.5/ 10 2.5/ 10 = P[−2.53 ≤ Z ≤ 1.27] = 0.8980 − 0.0057 = 0.8923 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 16
  17. Sai lầm loại I và loại II - Ví dụ Tương tự α, tăng cỡ mẫu sẽ làm giảm sai lầm β, với cỡ mẫu n = 16 và miền ¯ chấp nhận là 48 < X < 52, ta tính được β = 0.229. Bảng 1 tổng kết sai lầm lầm loại I và loại II với miền chấp nhận và cỡ mẫu khác nhau Miền chấp nhận n α β với µ = 52 β với µ = 50.5 48.5 < x < 51.5 ¯ 10 0.0574 0.2643 0.8923 48 < x < 52 ¯ 10 0.0114 0.5000 0.9705 48.5 < x < 51.5 ¯ 16 0.0164 0.2119 0.9445 48 < x < 52 ¯ 16 0.0014 0.5000 0.9918 Bảng 1: Sai lầm loại I và loại II Kiểm định giả thuyết thống kê Hoàng Văn Hà – 17
  18. Sai lầm loại I và loại II - Nhận xét 1. Ta có thể giảm kích thước của miền bác bỏ [tương ứng tăng kích thước miền chấp nhận], và xác suất sai lầm loại I α bằng cách chọn những điểm tới hạn thích hợp. 2. Xác suất sai lầm loại I và loại II có liên quan với nhau. Với một cỡ mẫu cố định, việc giảm sai lầm loại này sẽ làm tăng sai lầm loại kia. 3. Cố định các điểm tới hạn, tăng cỡ mẫu n sẽ làm giảm xác suất sai lầm loại I α và loại II β. 4. Nếu H0 sai, sai lầm β sẽ tăng khi giá trị thực của tham số tiến gần đến giá trị được phát biểu trong giả thuyết H0 . Kiểm định giả thuyết thống kê Hoàng Văn Hà – 18
  19. Sai lầm loại I và loại II - Ví dụ Ví dụ 3. 1. Xét X là biến ngẫu nhiên có phân phối nhị thức. Ta cần kiểm định giả thuyết H0 : p = 0.8 và đối thuyết H1 : p < 0.8. Hãy tìm miền bác bỏ {X ≤ c} và tính xác suất sai lầm loại I α và loại II β tương ứng với đối thuyết H1 : p = 0.6 khi n = 10 và n = 20. 2. Một mẫu ngẫu nhiên cỡ n được chọn từ tổng thể có phân phối chuẩn với phương sai σ 2 = 9, tính được x = 17. Ta cần kiểm định giả thuyết ¯ H0 : µ = 15 và H1 : µ > 15. Giả sử α = 0.05, ¯ a. Tìm miền bác bỏ có dạng {X > c}. b. Với đối thuyết H1 : µ = 16, tính β. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 19
  20. Bổ đề Neyman-Pearson Định nghĩa 4. Giả sử Z = h[X1 , . . . , Xn ] là một tiêu chuẩn kiểm định và Wα là miền bác bỏ của một bài toán kiểm định giả thuyết thống liên quan đến tham số θ. Độ mạnh của kiểm định là xác suất bác bỏ giả thuyết H0 khi đối thuyết H1 đúng, ký hiệu π. c π = P[Wα |H1 ] = 1 − P[Wα |H1 ] = 1 − β [5] Một tiêu chuẩn kiểm định tốt sẽ có độ mạnh cao. Định nghĩa 5. Xét bài toán kiểm định giả thuyết thống kê có giả thuyết H0 , đối thuyết H1 , miền bác bỏ Wα và miền chấp nhận Wα . Cho α, β lần lượt là c sai lầm loại I và loại II. Cố định giá trị α nhỏ, trong tất cả các tiêu chuẩn kiểm định Z = h[X1 , . . . , Xn ] có cùng mức sai lầm α thì tiêu chuẩn nào có độ mạnh π = 1 − β lớn nhất thì được gọi là tiêu chuẩn tốt nhất [tối ưu]. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 20

2014 FTU2 Chương 8

April 27, 2018 | Author: Anonymous | Category: N/A

DOWNLOAD PDF

Share Embed

Report this link



Short Description

Download 2014 FTU2 Chương 8...

Description

CHƯƠNG 8

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

1

Bài toán mở đầu Bài toán mở đầu buôn muốn xem xét sự ổn

Một hãng định về lượng hàng bán được trung bình trên mỗi nhân viên bán hàng so với những năm trước [lượng đó bằng 7,4]. Mẫu ngẫu nhiên gồm 40 nhân viên bán hàng được lựa chọn và thấy lượng hàng trung bình của họ là 6,1 với độ lệch chuẩn đã hiệu chỉnh s=2,5. Có thể nói rằng lượng hàng bán trung bình trên mỗi đầu người có sự thay đổi không? Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

2

Bài toán mở đầu • Gọi  là lượng hàng bán trung bình trên mỗi nhân viên năm nay. • Ta đặt giả thuyết như sau: H0:  không đổi [so với năm ngoái] H1:  thay đổi [so với năm ngoái] • Viết dưới dạng toán học:  H 0 :   7,4   H 1 :   7, 4

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài toán mở đầu Giải Bước 1. Theo định lý giới hạn trung tâm  2 X ~N  ,  n  

Bước 2. Giả sử H0 đúng, nghĩa là =7,4 2    X ~ N  7, 4 ;  n  

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

4

Bài toán mở đầu Bước 3. Chuẩn hóa:

Giải

X  7, 4   Z

n

 Bước 4. Ta có xác suất sau:



~ N  0 ;1 



P Z  1, 96  0 , 05 Có nghĩa là nếu H0 đúng thì khả năng |Z|1,96 là 5%, rất nhỏ. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

5

Bài toán mở đầu Giải Bước 5. Với mẫu đã chọn ta có: x  6 ,1 Z qs 

  s  2,5

 6 ,1  7 , 4 

40

n  40

  3 , 2887

2,5

Bước 6. Theo nguyên lý biến cố hiếm ta bác bỏ giả thuyết H0 [chấp nhận giả thuyết H1] ở mức ý nghĩa 5%. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

6

Giải thích nhanh • • • • •

Đây là bài toán kiểm định giả thuyết tham số. Tham số cần kiểm định: trung bình tổng thể  H0: giả thuyết ; H1: đối thuyết Z: tiêu chuẩn kiểm định 5%: mức ý nghĩa, ký hiệu:  là mức độ ít xảy ra của Z. • Miền |Z|1,96 gọi là miền bác bỏ giả thuyết. Thường ký hiệu: W • Zqs: giá trị quan sát trên mẫu còn gọi là giá trị kiểm định. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Giả thuyết – Đối thuyết Giả thuyết-Đối thuyết Giả thuyết: một mệnh đề [một câu khẳng định] về một vấn đề chưa biết nào đó. Ký hiệu: H0. Giả thuyết là một mệnh đề nên có thể đúng hoặc không đúng.

Đối thuyết: một mệnh đề trái [xung khắc] với giả thuyết. Ký hiệu: H1.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

8

Kiểm định giả thuyết Kiểm lý: định giả thuyết Dựa vào 2 nguyên  Nguyên lý xác suất nhỏ  Nguyên lý chứng minh phản chứng. Để kiểm định H0 ta làm như sau: 1. Giả sử rằng H0 đúng 2. Xây dựng một biến cố A có xác suất bé khi H0 đúng [gọi là mức ý nghĩa của phép kiểm định]. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

9

Kiểm định giả thuyết 3. Theo nguyên lý xác suất nhỏ thì trong một lần thử biến cố A sẽ không xảy ra. 4. Vì vậy nếu với một mẫu cụ thể nào đó mà:  A xảy ra thì giả thiết H0 đúng là vô lý và ta bác bỏ giả thiết H0.  A không xảy ra thì ta chưa có cơ sở để bác bỏ H0. Biến cố A được chọn theo H1 và được xây dựng theo tiêu chuẩn kiểm định. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

10

Tiêu chuẩn kiểm định [test thống kê]  Là một biến ngẫu nhiên.  Được xây dựng trên mẫu ngẫu nhiên và tham số cần kiểm định. Còn gọi là thống kê mẫu.  Ký hiệu: Z, T,  ... [tùy bài toán]  Tuy nhiên ta ký hiệu chung là Z cho tiện.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

11

Tiêu chuẩn kiểm định  Chọn mẫu ngẫu nhiên kích thước n: [X1,X2,…,Xn]  Xây dựng thống kê Z=Z [X1,X2,…,Xn,θ] , trong đó θ là tham số liên quan đến giả thuyết cần kiểm định.  Nếu H0 đúng thì thống kê Z có qui luật phân bố xác suất hoàn toàn xác định.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

12

Miền bác bỏ giả thiết Là miền giá trị của thống kê Z. Ký hiệu: Wα Với điều kiện H0 đúng, Z nhận giá trị trong miền Wα với xác suất bằng α.





P Z  W H 0   với α là mức ý nghĩa của kiểm định. Thông thường là 0,05 hay 0,01. Lưu ý: có vô số miền bác bỏ Wα thỏa mãn.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

13

Sai lầm loại 1 và sai lầm loại 2 Sai lầm loại 1: bác bỏ H0 khi H0 đúng. Sai lầm loại 1 sinh ra do kích thước mẫu quá nhỏ, do cách lấy mẫu…

P  Z  W  |H 0    Sai lầm loại 2: chấp nhận H0 khi H0 sai. Vậy xác suất sai lầm loại 2 xác định như sau:

P  Z  W  |H 1    Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

14

Sai lầm loại 1 và sai lầm loại 2 H0 đúng Bác bỏ H0 Chấp nhận H0

H0 sai

Sai lầm loại 1 Xác suất =α Sai lầm loại 2 Xác suất=β

Với cỡ mẫu cố định thì: • Giảm sai lầm loại 1 thì sẽ làm tăng sai lầm loại 2. • Giảm sai lầm loại 2 thì sẽ làm tăng sai lầm loại 1. Nếu muốn cả 2 sai lầm này cùng giảm thì chỉ còn cách tăng cỡ mẫu. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

15

Sai lầm loại 1 và sai lầm loại 2  Giả thiết H0 là quan trọng do đó sai lầm về nó càng nhỏ càng tốt.  Cố định xác suất sai lầm loại 1 ở mức ý nghĩa α.  Với mẫu kích thước n xác định, ta chọn miền bác bỏ Wα sao cho xác suất sai lầm loại 2 nhỏ nhất hoặc chấp nhận được.  Việc chọn miền bác bỏ tùy thuộc vào từng bài toán cụ thể. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

16

Giá trị quan sát • Ký hiệu: Zqs; Tqs; qs. • Là giá trị của Z tính trên mẫu cụ thể. Zqs=Z[x1,x2,…,xn,θ] • Với [x1,x2,…,xn] là giá trị cụ thể của mẫu ngẫu nhiên [X1,X2,…,Xn] hay mẫu ngẫu nhiên cụ thể.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

17

Qui tắc kiểm định giả thuyết So sánh Zqs với Wα:  Zqs Wα thì bác bỏ H0; thừa nhận H1.  Zqs  Wα chưa có cơ sở để bác bỏ H0 [trên thực tế là thừa nhận H0] Chú ý: không kết luận đúng – sai mà chỉ kết luận bác bỏ – chấp nhận khi kiểm định giả thuyết. Đồng thời phải nêu rõ bác bỏ – chấp nhận ở mức ý nghĩa nào.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

18

Tóm tắt các bước 1. Phát biểu H0 và H1. 2. Lập mẫu ngẫu nhiên kích thước n. 3. Xác định tiêu chuẩn kiểm định Z và phân phối xác suất của Z với điều kiện H0 đúng. 4. Với mức ý nghĩa α, xác định miền bác bỏ tốt nhất tùy theo đối thiết H1. 5. Tính giá trị quan sát của Z từ mẫu cụ thể. 6. So sánh giá trị quan sát với miền bác bỏ và kết luận. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

19

Ppxs của thống kê TB mẫu Tổng thể

TB mẫu

Chuẩn, đã biết 

 2  X ~ N  ;  n  

n>30, đã biết 

 2  X  N  ;  n  

n>30, chưa biết 

 2  X  N  ;  n  

Chuẩn, n30] Tổng thể có tỷ lệ p chưa biết. Ta xét 3 bài toán như sau:  H 0 : p  p 0  BT 1    H 1 : p  p 0

Bài giảng Xác suất Thống kê 2014

 H 0 : p  p 0  BT 2    H 1 : p  p 0

 H 0 : p  p 0  BT 3    H 1 : p  p 0

Nguyễn Văn Tiến

46

Tiêu chuẩn kiểm định Kiểm định tỷ lệ tổng thể: Z 

F

 p

n

p 1  p 

~ N  0; 1 

Giả sử H0 đúng ta có: Z 

F

 p0 

n

p 0 1  p 0 

Bài giảng Xác suất Thống kê 2014

~ N  0; 1 

Nguyễn Văn Tiến

Kiểm định hai phía Bài toán kđ: BT 1

Miền bác bỏ của Z~N[0;1]

 H 0 : p  p 0   H 1 : p  p 0

  Bác bỏ

Bác bỏ

Mức ý nghĩa: α  t 1 

t 1  2

2

  W   Z   

F  p  n p 1  p  0

0

Bài giảng Xác suất Thống kê 2014

0

Z  t 1  2

   i   t 1   vôù    2 

 1   2 

Nguyễn Văn Tiến

48

Kiểm định một phía Bài toán kđ: BT 2

Miền bác bỏ của Z~N[0;1]

 H 0 : p  p 0   H 1 : p  p 0

  Bác bỏ

Mức ý nghĩa: α 0

t 1 2  2

  W   Z   

F  p  n p 1  p  0

0

Bài giảng Xác suất Thống kê 2014

0

Z  t 1 2  2

    vôiù   t 1  2    2 

 1  2   2 

Nguyễn Văn Tiến

49

Kiểm định một phía Bài toán kđ: BT 3

Miền bác bỏ của Z~N[0;1]

 H 0 : p  p 0   H 1 : p  p 0

  Bác bỏ

Mức ý nghĩa: α  t 1 2 

0

2

  W   Z   

F  p  n p 1  p  0

0

Z   t 1 2 

0

Bài giảng Xác suất Thống kê 2014

2

    vôiù   t 1  2    2 

 1  2   2 

Nguyễn Văn Tiến

50

Ví dụ 1 Một đảng chính trị trong một cuộc bầu cử tổng thống ở nước nọ tuyên bố rằng ít nhất 45% cử tri sẽ bỏ phiếu cho ứng viên A của họ. Chọn ngẫu nhiên 2000 cử tri để cho ý kiến thì thấy 862 cử tri tuyên bố sẽ bỏ phiếu cho A. Với mức ý nghĩa 5% hãy kiểm định xem dự đoán của đảng trên có đúng không? Giải: Gọi p là tỉ lệ cử tri sẽ bỏ phiếu cho ứng viên A. Ta có bài toán kiểm định:  H 0 : p  0 , 45   H 1 : p  0 , 45 Bài giảng Xác suất Thống kê 2014



 0 , 05  Nguyễn Văn Tiến

51

Ví dụ 1 Tỉ lệ mẫu cụ thể: f=862/2000=0,431   0 , 05  t 1 2   t 0 ,45  1, 645 2

Giá trị kiểm định: Z 

 0 , 431  0 , 45  0 , 45 .0 , 55

2000

  1, 708  W

Như vậy bác bỏ H0.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

52

Ví dụ 2 Dự đoán tỉ lệ phế phẩm trong kho lớn hơn 11%. Kiểm tra ngẫu nhiên 100 sản phẩm thì thấy có 13 phế phẩm. Với mức ý nghĩa 5% thì báo cáo trên có đáng tin hay không?

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

53

KIỂM ĐỊNH PHƯƠNG SAI Điều kiện: hoặc cỡ mẫu n>30 hoặc tổng thể có phân phối chuẩn. Xét bài toán này trong 2 trường hợp: 1. Đã biết trung bình tổng thể . 2. Chưa biết trung bình tổng thể .  H 0 :  2   2 0 Ta xét 3 bài toán BT 1   2 2 H 1 :    0 

 H 0 :  2   2 0 như sau: BT 2   2 2 H 1 :    0 

Bài giảng Xác suất Thống kê 2014

 H 0 :  2   2 0 BT 3   2 2 H 1 :    0 

Nguyễn Văn Tiến

54

Phân phối của hàm PS mẫu Tổng thể

PS mẫu

Chuẩn, đã biết 

S

*



Hàm của PS mẫu

2

Z 

Không chuẩn * 2 S  ,  n  30   đã biết 

S

Chuẩn chưa biết 

Không chuẩn chưa biết 



2

 i 1

2

 Xi        

2

n

2

S ,  n  30 

Bài giảng Xác suất Thống kê 2014



n

Z ~ 

Z  2

nS

*2

 n  1 S 

2

Z ~ 

2

n





i 1

2

 Xi  X      

2

 n  1 Nguyễn Văn Tiến

55

Tiêu chuẩn kiểm định Kiểm định phương sai tổng thể: Z 

Hoặc: Z 

nS 

*2 2

 n  1 S

Bài giảng Xác suất Thống kê 2014



2

~ 

2

n

2

~

2

 n  1

Nguyễn Văn Tiến

Kiểm định hai phía_TH2 Miền bác bỏ của Z~χ2[n-1]

Bài toán kđ: BT 1

 H 0 :  2   2 0  2 2 H 1 :     0

 

Mức ý nghĩa: α 0  n 1

  1

  n 1    2

 2

2  n  1 S    W   Z  Z   n 1 2 0  

Bài giảng Xác suất Thống kê 2014

  hay Z     1





n 1

2

2

    

Nguyễn Văn Tiến

57

Kiểm định một phía_TH2 Miền bác bỏ của Z~χ2[n-1]

Bài toán kđ: BT 2

 H 0 :  2   2 0  2 2 H 1 :     0

 

Mức ý nghĩa: α 0   n  1 S  W   Z  2   0 

2

Bài giảng Xác suất Thống kê 2014

  Z   n 1      

 n 1   

Nguyễn Văn Tiến

58

Kiểm định một phía_TH2 Miền bác bỏ của Z~χ2[n-1]

Bài toán kđ: BT 3

 H 0 :  2   2 0  2 2 H 1 :     0

 

Mức ý nghĩa: α 0

 n 1  1   

2   n  1 S     W   Z  Z   n 1  1     2 0    

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

59

Ví dụ 1. Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 15 chi tiết do máy sản xuất và tính được s2=14,6. Với mức ý nghĩa 1% hãy kết luận về hoạt động của máy biết rằng kích thước chi tiết do máy sản xuất ra là biến ngẫu nhiên có phân phối chuẩn và phương sai theo thiết kế là σ02=12

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

60

Bài 1 Giám đốc một xí nghiệp cho biết lương trung bình của 1 công nhân thuộc xí nghiệp là 2 triệu đồng một tháng. Chọn ngẫu nhiên 40 công nhân thấy lương trung bình là 1,8 triệu một tháng và độ lệch chuẩn h/c là 500 ngàn. Lời báo cáo của giám đốc có tin cậy được không với mức ý nghĩa là 5%?

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài 2 Theo một nguồn tin thì tỉ lệ hộ dân thích xem ca nhạc trên tivi là 80%. Thăm dò 49 hộ dân thấy có 25 hộ thích ca nhạc. Với mức ý nghĩa 5%. Kiểm định xem nguồn tin ấy có đáng tin không?

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài 3 Một máy sản xuất tự động lúc đầu tỉ lệ sản phẩm loại A là 50%. Sau khi áp dụng một phương pháp sản xuất mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm để kiểm tra. Kết quả kiểm tra cho ở bảng sau : Số sp loại A trong mẫu Số mẫu

1

2

3

4

5

6

7

8

9

10

2

0

4

6

8

10

4

5

1

0

Với mức ý nghĩa 5%. Hãy cho kết luận về phương pháp sản xuất này?

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài 4 Tỉ lệ phế phẩm của một nhà máy trước đây là 5%. Năm nay nhà máy áp dụng một biện pháp kĩ thuật mới. Để nghiên cứu tác dụng của biện pháp này người ta lấy một mẫu gồm 800 sản phẩm để kiểm tra và thấy có 24 sản phẩm. Với α = 0,01. Hãy cho kết luận về biện pháp kĩ thuật mới này? Nếu nhà máy báo cáo tỉ lệ phế phẩm sau khi áp dụng biện pháp kĩ thuật mới này là 2% thì có chấp nhận được không? [với α = 0,05]. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài 5 Một cửa hàng tạp hoá nhận thấy thời gian vừa qua trung bình một khách hàng mua 25 ngàn thuốc lá trong ngày. Nay cửa hàng chọn ngẫu nhiên 15 khách hàng thấy trung bình một khách hàng mua 24 ngàn đồng và đlc mẫu điều chỉnh là 2 ngàn đồng. Với mức ý nghĩa 5%, thử xem có phải sức mua của khách hàng hiện nay đã giảm sút? Giả sử số tiền mua thuốc có pp chuẩn

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài 6 Nếu máy móc hoạt động bình thường thì kích thước của một loại sản phẩm tính theo cm là một đại lượng ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 25 . Nghi ngờ máy hoạt động không bình thường , người ta đo thử 20 sản phẩm và tính được phương sai hiệu chỉnh là 27,5. Với α = 0,02 hãy kết luận về điều nghi ngờ này.

Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

Bài 7 Biết độ chịu lực X của các mẫu bê tông có phân phối chuẩn, đo độ chịu lực của 200 mẫu bê tông ta có kết quả sau: Độ chịu lực

195

205

215

225

235

245

Số mẫu

13

18

46

74

34

15

Với mức ý nghĩa 5% hãy kiểm định giả thuyết thống kê:  H 0 :   230   H 1 :   230 Bài giảng Xác suất Thống kê 2014

hay

 H 0 :   230   H 1 :   230 Nguyễn Văn Tiến

Bài 8 Chiều cao một loại cây là biến ngẫu nhiên có phân phối chuẩn. Trong điều kiện phát triển bình thường thì phương sai của chiều cao loại cây đó là [0,5m]2 . Để điều tra người ta tiến hành đo thử 26 cây thì thấy phương sai mẫu hiệu chỉnh là [0,54m]2. Nếu phương sai cây thay đổi thì do cây phát triển không đều và cần cải tiến kĩ thuật. Với mẫu trên có cần phải cải tiến lại kĩ thuật hay không ở mức ý nghĩa 5%. Bài giảng Xác suất Thống kê 2014

Nguyễn Văn Tiến

68

View more...

Comments

Video liên quan

Chủ Đề