Bài tập mô hình hồi quy tuyến tính năm 2024

  • 1. QUY ĐƠN 03 Có kết quả khảo sát một số doanh nghiệp như sau : Trong đó : Y : Doanh thu của các doanh nghiệp [tỷ đồng/năm] X : Chi phí quảng cáo [tỷ đồng/năm] 1. Tìm hàm hồi quy mẫu [SRF] từ số liệu trên ? 2. Chi phí quảng cáo có thực sự ảnh hưởng đến doanh thu không, với độ tin cậy 95% ? 3. Nếu tăng chi phí quảng cáo 1 tỷ đồng thì doanh thu tăng tối đa là bao nhiêu, mức ý nghĩa 5% ? 1
  • 2. tin cậy cho phương sai nhiễu, có thể kết luận phương sai nhiễu = 7 được không, độ tin cậy 95% ? 5. Mô hình trên có phù hợp với dữ liệu khảo sát hay không, mức ý nghĩa 5% ? 6. Thành lập bảng phân tích phương sai của mô hình [ANOVA] và giải thích ý nghĩa các hệ số ? 7. Dự báo doanh thu trung bình cho các doanh nghiệp có chi phí quảng cáo 6 tỷ/năm, mức ý nghĩa 5% ? 8. Dự báo doanh thu cá biệt cho một doanh nghiệp có chi phí quảng cáo 6 tỷ/năm, độ tin cậy 95% ? 9. Nếu doanh nghiệp thay đổi đơn vị tính doanh thu thành triệu đồng/tháng thì hàm SRF thay đổi thế nào ? 10. Chi phí quảng cáo thay đổi 1% thì doanh thu thay đổi thế nào? 2
  • 3. hồi quy mẫu : Từ số liệu đã cho ta lập bảng như sau : 3
  • 4. thức ta có : β1 = Y - β2X = 63,5 - 9,1915*4,25 = 24,4361 Hàm hồi quy mẫu có dạng : Ŷ = 24,4361 + 9,1915X. 4 β2 = YX - n*Y *X X2 - n[X]2 = 2375 – 8*63,5*4,25 168 - 8*[4,25]2 = 9,1915
  • 5. quảng cáo có thực sự ảnh hưởng đến doanh thu không, với độ tin cậy 95% ? Kiểm định giả thiết : Ho : β2 = 0 H1 : β2 ≠ 0 Ta cần tính các hệ số : TSS = Y2 - n[Y]2 = 2034 – 8[63,5]2 = 2034 ESS = β22x2 = [9,1915]2*23,5 = 1985,4 RSS = TSS – ESS = 48,6 2 = = = 8,1 5 x2 = X2 - n[X]2 = 168 - 8*[4,25]2 = 23,5 RSS n - k 48,6 6
  • 6. = 0,3447  Se[β2] = 0,5871 Độ tin cậy 95% → tα/2[n-k] = t0,025[6] = 2,447 Tiêu chuẩn kiểm định : t = = = 15,6556 Ta thấy : | t | = 15,6556 > t0,025[6] = 2,447 nên bác bỏ giả thiết Ho. Vậy với độ tin cậy 95%, chi phí quảng cáo thực sự ảnh hưởng đến doanh thu. 6 2 x2 8,1 23,5 β2 Se[β2] 9,1915 0,5871
  • 7. kiến cho rằng khi tăng chi phí quảng cáo 1 tỷ đồng/năm thì doanh số tăng hơn 10 tỷ/năm. Tuy nhiên, một số ý kiến khác lại cho rằng tăng chi phí quảng cáo 1 tỷ/năm thì doanh số tăng không quá 9 tỷ/năm. Cả hai ý kiến trên có chính xác không, hãy kết luận với độ tin cậy 95% ? Kiểm định các giả thiết sau : + Ý kiến thứ nhất : Ho : β2 ≤ 10 H1 : β2 > 10 + Ý kiến thứ hai : Ho : β2 ≥ 9 H1 : β2 < 9 Đây là kiểm định 1 phía nên giá trị tới hạn : tα[n-k] = t0,05[6] = 1,943 7
  • 8. tiêu chuẩn kiểm định : t = = = - 1,3771 Nếu : t > tα[n-k] thì bác bỏ Ho. Ta thấy, t = - 1,3771 < t0,05[6] = 1,943 nên chấp nhận Ho. Vậy ý kiến đầu tiên không chính xác với độ tin cậy 95%. t = = = 0,3262 Nếu : t < - tα[n-k] thì bác bỏ Ho. Ta thấy, t = 0,3262 > - t0,05[6] = - 1,943 nên chấp nhận Ho. Vậy ý kiến thứ hai cũng không chính xác với độ tin cậy 95%. 8 β2 - β2* Se[β2] 9,1915 - 10 0,5871 β2 - β2* Se[β2] 9,1915 - 9 0,5871
  • 9. chi phí quảng cáo 1 tỷ đồng thì doanh thu tăng tối đa là bao nhiêu, mức ý nghĩa 5% ? Tìm khoảng tin cậy cho hệ số góc : Mức ý nghĩa 5% → tα/2[n-k] = t0,025[6] = 2,447 Ta có công thức tính khoảng tin cậy : [ β2 - tα/2[n-k]Se[β2] ≤ β2 ≤ β2 + tα/2[n-k]Se[β2]]  [9,1915 - 2,447*0,5871 ≤ β2 ≤ 9,1915 + 2,447*0,5871]  [ 7,7549 ; 10,4366] Với độ tin cậy 95%, nếu tăng chi phí quảng cáo 1 tỷ đồng/năm thì doanh thu tăng thấp nhất là 7,76 tỷ và cao nhất là 10,44 tỷ. 9
  • 10. tin cậy cho phương sai nhiễu, có thể kết luận phương sai nhiễu = 7 được không, độ tin cậy 95% ? ** Khoảng tin cậy phương sai nhiễu : Khoảng tin cậy của Var[Ui] = 2 là : ; Ta có α = 5% → 2 [n-k] = 2[6] = 14,4494 ; 2 [n-k] = 2[6] = 1,2373 ;  [ 3,3635 ; 39,2791] 10 [n – k] 2 2 [n-k] [n – k] 2 2 [n-k] α/2 1 - α/2 α/2 1 - α/2 0,975 0,025 6*8,1 14,4494 6*8,1 1,2373
  • 11. giả thiết : Ho : 2 = 7 H1 : 2 ≠ 7 Tiêu chuẩn kiểm định : 2 = = = 6,943 Ta thấy , 2 = 6,943 thuộc khoảng [1,2373 ; 14,4494] nên chấp nhận Ho. Vậy, với độ tin cậy 95%, có thể xem phương sai nhiễu = 15. Hoặc ta có thể so sánh 2 = 7 với khoảng tin cậy tìm được [ 3,3635 ; 39,2791 ]. Giá trị 7 nằm trong khoảng tin cậy của phương sai nhiễu nên chấp nhận Ho. 11 [n – k] 2 2 6*8,1 7
  • 12. trên có phù hợp với dữ liệu khảo sát hay không, mức ý nghĩa 5% ? Kiểm định giả thiết : Ho : R2 = 0 ; H1 : R2 > 0 Mức ý nghĩa α = 0,05 → F0,05[k-1, n-k] = F0,05[1,6] = 5,987 R2 = = = 0,9761 Tiêu chuẩn kiểm định : F = = = 245,046 Ta thấy : F = 245,046 > F0,05[1, 6] = 5,987, nên bác bỏ Ho. Vậy với độ tin cậy 95%, mô hình phù hợp với dữ liệu khảo sát. 12 ESS TSS 1985,4 2034 R2 1 - R2 n - k k - 1 0,9761*6 1 – 0,9761
  • 13. bảng phân tích phương sai của mô hình [ANOVA] và giải thích ý nghĩa các hệ số ? 13
  • 14. doanh thu trung bình cho các doanh nghiệp có chi phí quảng cáo 6 tỷ/năm, mức ý nghĩa 5% ? Dự báo điểm : Độ tin cậy 95% → tα/2[n-k] = t0,025[6] = 2,447 Ta có hàm hồi quy : Ŷo = 24,4361 + 9,1915X*6 = 79,5851 Công thức ước lượng khoảng tin cậy : [Ŷo - tα/2[n-k]Se[Ŷo] ≤ E[Y/Xo] ≤ Ŷo + tα/2[n-k]Se[Ŷo]] Var[Ŷo] = 2 [ + ] = 8,1 [ + ] = 2,0681  Se[Yo] = 1,4381  [79,58 - 2,447*1,4381 ≤ E[Y/Xo=6] ≤ 79,58 + 2,447*1,4381]  [76,061 ; 83,099] 14 1 n [Xo – X]2 x2 1 8 [6 – 4,25]2 23,5
  • 15. doanh thu cá biệt cho một doanh nghiệp có chi phí quảng cáo 6 tỷ/năm, độ tin cậy 95% ? Ta cần tìm khoảng tin cậy cá biệt : Var[Y] = 2 [ 1 + + ] = = 8,1 [ 1 + + ] = 10,1681  Se[Y] = 3,1887  [79,58 - 2,447*3,1887 ≤ Y ≤ 79,58 + 2,447*3,1887]  [ 71,7772 ; 87,3828] Khoảng dự báo cá biệt rộng hơn dự báo trung bình. 15 1 n [Xo – X]2 x2 1 8 [6 – 4,25]2 23,5
  • 16. nghiệp thay đổi đơn vị tính doanh thu thành triệu đồng/tháng thì hàm SRF thay đổi thế nào ? Đơn vị tính của Y chuyển từ tỷ sang triệu, tức là : Y* = 1000Y , do đó k1 = 1000 Đơn vị tính của X không thay đổi, tức là : X* = X , do đó k2 = 1 Vậy : β1* = k1*β1 = 24,436*1000 = 24436 β2* = *β2 = *9,192 = 9192 Ta có : năm  tháng nên Ko = 12 Vậy hàm hồi quy mới : Y* = 24436/12 + 9192/12X* = 2036,33 + 766X* 16 k1 k2 1000 1
  • 17. quảng cáo thay đổi 1% thì doanh thu thay đổi thế nào? Hệ số co giãn cho biết thay đổi tương đối [%] của Y khi X thay đổi 1%. Ta có : E = f’[X] = 2 = 9,1915 = 0,6152 Chi phí quảng cáo và doanh thu đồng biến. Do đó, khi khi chi phí quảng cáo tăng [giảm] 1% thì doanh thu tăng [giảm] 0,6152%. 17 YX X Y X Y 4,25 63,5
  • 18.
  • 19. thích : 1. Hệ số S.D.dependent Var = 17,046 : là độ lệch chuẩn của Y. Mối quan hệ của nó với các tham số khác trong mô hình như sau: - Phương sai của Y : Var[Y] = Tử số chính là TSS, nên : Var[Y] = = = 290,5714 Ký hiệu : Var[Y] = S2y = 290,5714  Sy = 17,046 Trong trường hợp chưa biết TSS nhưng có được hệ số này ta có thể tính được TSS : TSS = [Sy]2[n-1] = [17.046]2*[7] = 2034 19 ∑Y2 – n[Y]2 n - 1 TSS n - 1 2034 7
  • 20. xác định bội trong mô hình chính là hệ số tương quan giữa Y và Ŷ , cụ thể tính như sau : Ta tính được hàm hồi quy mẫu : Ŷ = 6,2979 + 9,2766X Từ hàm SRF này ta tính được Y và Ŷ như bảng sau : Từ bảng tính toán, ta tính hệ số tương quan giữa Y và Ŷ theo công thức : R2 = = = 0,976 = = [0,9879]2 20 ryŷ = ∑YŶ – n[Y][Ŷ] ∑Y2 –n[Y]2 ∑Ŷ2 –n[Ŷ]2 = 34243 – 8[63,5][63,5] 34292 – 8[63,5]2 34243 – 8[63,5]2 = 0,9879 ESS TSS 1985,4 2034 [ryŷ ]2
  • 21.
  • 22. tính trên, ta có một lưu ý : - Hệ số xác định bội cho biết độ mạnh của đường tuyến tính [Ŷ] và số liệu quan sát [Y]. Do đó, mô hình có hệ số R2 lớn không có nghĩa là mối quan hệ giữa Y [biến phụ thuộc] và X [biến độc lập] mạnh. - Một mô hình có R2 nhỏ không đồng nghĩa là giữa X và Y có mối quan hệ yếu hoặc không có mối quan hệ. Có thể giữa X và Y có mối quan hệ phi tuyến [Hệ số xác định bội trong mô hình hồi quy đo độ mạnh của mối liên hệ tuyến tính – đường thẳng]. 22

Chủ Đề