Fixed effect model là gì

Hồi quy sử dụng dữ liệu bảng có thể giảm thiểu omitted variable bias khi không có thông tin các biến tương quan với các biến được giải thích và biến giải thích và nếu những biến này là hằng số về chiều thời gian và các chủ thể đối tượng.

Chương này mô tả các chủ đề sau:

  • ký hiệu liên quan đến dữ liệu bảng.
  • hồi quy tác động cố định [ fixed effect regression] bằng cách cố định chiều thời gian, hoặc chiều không gian, hoặc cả hai.
  • tính sai số chuẩn đối với hồi quy tác động cố định.

Ta ứng dụng bộ dữ liệu Fatalities từ package AER liên quan đến các quan sát tai nạn giao thông Mỹ từ 1982 đến 1988. Ta khảo sát tác động của thuế bia và luật lái xe khi say.

Trong chương này ta sử dụng các package sau.

Khác với dữ liệu cross-section data khi ta quan sát \[n\] chủ thể, dữ liệu bảng có \[n\] chủ thể tại \[T \ge 2\] thời điểm khác nhau. Ta ký hiệu: \[[X_{it}, Y_{it}]\].

Ta khảo sát dữ liệu Fatalities trong R như sau.

# load the package and the dataset library[AER] data[Fatalities] # obtain the dimension and inspect the structure is.data.frame[Fatalities]
## [1] TRUE## [1] 336 34## 'data.frame': 336 obs. of 34 variables: ## $ state : Factor w/ 48 levels "al","az","ar",..: 1 1 1 1 1 1 1 2 2 2 ... ## $ year : Factor w/ 7 levels "1982","1983",..: 1 2 3 4 5 6 7 1 2 3 ... ## $ spirits : num 1.37 1.36 1.32 1.28 1.23 ... ## $ unemp : num 14.4 13.7 11.1 8.9 9.8 ... ## $ income : num 10544 10733 11109 11333 11662 ... ## $ emppop : num 50.7 52.1 54.2 55.3 56.5 ... ## $ beertax : num 1.54 1.79 1.71 1.65 1.61 ... ## $ baptist : num 30.4 30.3 30.3 30.3 30.3 ... ## $ mormon : num 0.328 0.343 0.359 0.376 0.393 ... ## $ drinkage : num 19 19 19 19.7 21 ... ## $ dry : num 25 23 24 23.6 23.5 ... ## $ youngdrivers: num 0.212 0.211 0.211 0.211 0.213 ... ## $ miles : num 7234 7836 8263 8727 8953 ... ## $ breath : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ... ## $ jail : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 2 2 2 ... ## $ service : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 2 2 2 ... ## $ fatal : int 839 930 932 882 1081 1110 1023 724 675 869 ... ## $ nfatal : int 146 154 165 146 172 181 139 131 112 149 ... ## $ sfatal : int 99 98 94 98 119 114 89 76 60 81 ... ## $ fatal1517 : int 53 71 49 66 82 94 66 40 40 51 ... ## $ nfatal1517 : int 9 8 7 9 10 11 8 7 7 8 ... ## $ fatal1820 : int 99 108 103 100 120 127 105 81 83 118 ... ## $ nfatal1820 : int 34 26 25 23 23 31 24 16 19 34 ... ## $ fatal2124 : int 120 124 118 114 119 138 123 96 80 123 ... ## $ nfatal2124 : int 32 35 34 45 29 30 25 36 17 33 ... ## $ afatal : num 309 342 305 277 361 ... ## $ pop : num 3942002 3960008 3988992 4021008 4049994 ... ## $ pop1517 : num 209000 202000 197000 195000 204000 ... ## $ pop1820 : num 221553 219125 216724 214349 212000 ... ## $ pop2124 : num 290000 290000 288000 284000 263000 ... ## $ milestot : num 28516 31032 32961 35091 36259 ... ## $ unempus : num 9.7 9.6 7.5 7.2 7 ... ## $ emppopus : num 57.8 57.9 59.5 60.1 60.7 ... ## $ gsp : num -0.0221 0.0466 0.0628 0.0275 0.0321 ...
# list the first few observations head[Fatalities]
## state year spirits unemp income emppop beertax baptist mormon ## 1 al 1982 1.37 14.4 10544.15 50.69204 1.539379 30.3557 0.32829 ## 2 al 1983 1.36 13.7 10732.80 52.14703 1.788991 30.3336 0.34341 ## 3 al 1984 1.32 11.1 11108.79 54.16809 1.714286 30.3115 0.35924 ## 4 al 1985 1.28 8.9 11332.63 55.27114 1.652542 30.2895 0.37579 ## 5 al 1986 1.23 9.8 11661.51 56.51450 1.609907 30.2674 0.39311 ## 6 al 1987 1.18 7.8 11944.00 57.50988 1.560000 30.2453 0.41123 ## drinkage dry youngdrivers miles breath jail service fatal nfatal ## 1 19.00 25.0063 0.211572 7233.887 no no no 839 146 ## 2 19.00 22.9942 0.210768 7836.348 no no no 930 154 ## 3 19.00 24.0426 0.211484 8262.990 no no no 932 165 ## 4 19.67 23.6339 0.211140 8726.917 no no no 882 146 ## 5 21.00 23.4647 0.213400 8952.854 no no no 1081 172 ## 6 21.00 23.7924 0.215527 9166.302 no no no 1110 181 ## sfatal fatal1517 nfatal1517 fatal1820 nfatal1820 fatal2124 nfatal2124 ## 1 99 53 9 99 34 120 32 ## 2 98 71 8 108 26 124 35 ## 3 94 49 7 103 25 118 34 ## 4 98 66 9 100 23 114 45 ## 5 119 82 10 120 23 119 29 ## 6 114 94 11 127 31 138 30 ## afatal pop pop1517 pop1820 pop2124 milestot unempus emppopus ## 1 309.438 3942002 208999.6 221553.4 290000.1 28516 9.7 57.8 ## 2 341.834 3960008 202000.1 219125.5 290000.2 31032 9.6 57.9 ## 3 304.872 3988992 197000.0 216724.1 288000.2 32961 7.5 59.5 ## 4 276.742 4021008 194999.7 214349.0 284000.3 35091 7.2 60.1 ## 5 360.716 4049994 203999.9 212000.0 263000.3 36259 7.0 60.7 ## 6 368.421 4082999 204999.8 208998.5 258999.8 37426 6.2 61.5 ## gsp ## 1 -0.02212476 ## 2 0.04655825 ## 3 0.06279784 ## 4 0.02748997 ## 5 0.03214295 ## 6 0.04897637
# summarize the variables 'state' and 'year' summary[Fatalities[, c[1, 2]]]
## state year ## al : 7 1982:48 ## az : 7 1983:48 ## ar : 7 1984:48 ## ca : 7 1985:48 ## co : 7 1986:48 ## ct : 7 1987:48 ## [Other]:294 1988:48

Ta thấy bộ dữ liệu bao gồm \[336\] quan sát và \[34\] biến. Chú ý rằng state là biến nhân tố với \[48\] bậc, ứng với \[48\] tiểu bang kề nhau của Mỹ. Biến year cũng là biến nhân tố với \[7\] bậc xác định thời gian quan sát. Do đó ta có \[7\times 48 = 336\] quan sát. Bởi vì không có dữ liệu trống, nên bộ dữ liệu xác định cân bằng [ balanced], trong trường hợp có dữ liệu trống, bộ dữ liệu trở thành phi cân bằng [ unbalanced].

Ta ước lượng hồi quy đơn giản giữa thuế bia [được điều chỉnh so với đồng đô la 1988] và tỷ lệ tai nạn giao thông.

# define the fatality rate Fatalities$fatal_rate

Chủ Đề