Thế nào là tuyến tính và phi tuyến

Chương 11 Hàm hồi quy phi tuyến

Cho đến giờ ta mang định hàm hồi quy là con đường tính, tức là tham mê số nghiêng của hàm hồi quy là hằng số. Điều này hàm ý, ảnh hưởng lên (Y) của một đơn vị đổi khác của (X) ko nhờ vào vào giá trị của (X). Nếu ảnh hưởng này thiệt sự phụ thuộc vào vào quý hiếm của (X), ta cần được áp dụng hàm hồi quy phi con đường.

Bạn đang xem: Thế nào là tuyến tính và phi tuyến


# prepare the datadata(CASchools)CASchools$size CASchools$students/CASchools$teachersCASchools$score (CASchools$read + CASchools$math) / 2cor(CASchools$income, CASchools$score)
## <1> 0.7124308Ta thấy tất cả sự đối sánh tương quan đường tính dương sống nhì biến này: thu nhập cá nhân bên trên vừa phải thì điểm thi trên vừa phải. Liệu hồi quy con đường tính tất cả ước tính được quan hệ nam nữ tài liệu.


# fit a simple linear modellinear_mã sản phẩm lm(score ~ income, data = CASchools)# plot the observationsplot(CASchools$income, CASchools$score, col = "steelblue", pch = đôi mươi, xlab = "District Income (thousands of dollars)", ylab = "Test Score", cex.main = 0.9, main = "Test Score vs. District Income & a Linear OLS Regression Function")# add the regression line to the plotabline(linear_model, col = "red", lwd = 2)

*

Ta thấy rằng lúc thu nhập cao thì con đường hồi quy vẫn khoảng chừng “lố” quan hệ nam nữ đúng tuy vậy Khi thu nhập vừa đủ thì con đường hồi quy lại ước chừng “không đủ”.

Ta chăm chú một quy mô bậc hai như sau.

< extĐiểm thi = eta_0 + eta_1 extThu nhập_i + eta_2 extThu nhập_i^2 + u_i>

Khi kia ( extThu nhập_i^2) được dùng nhỏng một biến chuyển phân tích và lý giải không giống mang lại điểm thi. Ta lưu ý kết quả trong R nhỏng sau.

income3.851***
(0.268)
I(income2)-0.042***
(0.005)
Constant607.302***
(2.902)
Notes:***Significant at the 1 percent level.
**Significant at the 5 percent cấp độ.
*Significant at the 10 percent level.

Mô hình này có thể chấp nhận được ta kiểm nghiệm dục tình thân các khoản thu nhập và điểm thi là con đường tính tuyệt phi đường bậc hai. Nói cách khác:

<egincases H_0: eta_2 = 0 \ H_A: eta_2 e 0 endcases>

Ta thấy rằng (H_0) bị chưng quăng quật sinh hoạt bất kỳ mức ý nghĩa sâu sắc thông thường như thế nào, vì vậy ta Tóm lại tình dục thân nhị phát triển thành là phi tuyến đường. Vấn đề này cũng trùng khớp cùng với mẫu vẽ tiếp sau đây.


# draw a scatterplot of the observations for income & chạy thử scoreplot(CASchools$income, CASchools$score, col = "steelblue", pch = trăng tròn, xlab = "District Income (thousands of dollars)", ylab = "Test Score", main = "Estimated Linear và Quadratic Regression Functions")# add a linear function khổng lồ the plotabline(linear_mã sản phẩm, col = "black", lwd = 2)# add quatratic function to lớn the plotorder_id order(CASchools$income)lines(x = CASchools$income, y = fitted(quadratic_model), col = "red", lwd = 2)

*


11.2 Hàm phi tuyến đường so với đổi thay solo nhất


11.2.1 Hàm nhiều thức

Từ ý tưởng hàm bậc hai, ta hoàn toàn có thể không ngừng mở rộng ra thành hàm đa thức tổng quát:

Trong R ta sử dụng hàm poly() nhằm trình bày số bậc quy mô. Chẳng hạn cùng với mô hình bậc 3 ta code nhỏng sau.


# estimate a cubic modelcubic_Mã Sản Phẩm lm(score ~ poly(income, degree = 3, raw = TRUE), data = CASchools)
Ta có thể dùng kiểm định thống kê lại (F) nhằm xác thực mô hình đường tính tuyệt phi đường mang đến bậc nào đó. Chẳng hạn, ta quyên tâm mang đến bậc 3 quy mô.


# chạy thử the hypothesis of a linear mã sản phẩm against quadratic or polynomial# alternatives# mix up hypothesis matrixR rbind(c(0, 0, 1, 0), c(0, 0, 0, 1))# do the testlinearHypothesis(cubic_model, hypothesis.matrix = R, white.adj = "hc1")
## Linear hypothesis test## ## Hypothesis:## poly(income, degree = 3, raw = TRUE)2 = 0## poly(income, degree = 3, raw = TRUE)3 = 0## ## Model 1: restricted model## Model 2: score ~ poly(income, degree = 3, raw = TRUE)## ## Note: Coefficient covariance matrix supplied.## ## Res.Df Df F Pr(>F) ## 1 418 ## 2 416 2 37.691 9.043e-16 ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Ở trên đây ta vẫn lưu ý trả ttiết (H_0: eta_2 = eta_3 = 0) bằng cách tận dụng phxay toán thù ma trận:

<eginaligned mathbfReta &= s \ eginpmatrix 0 và 0 và 1 & 0 \ 0 & 0 và 0 và 1 endpmatrix eginpmatrix eta_0 \ eta_1 \ eta_2 \ eta_3 endpmatrix &= eginpmatrix 0 \ 0 endpmatrix \ eginpmatrix eta_2 \ eta_3 endpmatrix &= eginpmatrix 0 \ 0 endpmatrix endaligned>

Bởi vị hàm linearHypothesis() áp dụng các vector (0) cho nên việc sử dụng một ma trận (mathbfR) sẽ tinh giảm được đoạn code. Ta thấy (p)-value tương đối nhỏ tuổi cùng vì vậy ta chưng vứt (H_0).

Trong thực tiễn, nhằm xác định được bậc mô hình, ta nên kiểm nghiệm (t) các lần từ một số trong những bậc lớn số 1 nào kia (r). Ta rất có thể thấy trong khúc code tiếp sau đây.


summary(cubic_model)
## ## Call:## lm(formula = score ~ poly(income, degree = 3, raw = TRUE), data = CASchools)## ## Residuals:## Min 1Q Median 3Q Max ## -44.28 -9.21 0.20 8.32 31.16 ## ## Coefficients:## Estimate Std. Error t value## (Intercept) 6.001e+02 5.830e+00 102.937## poly(income, degree = 3, raw = TRUE)1 5.019e+00 8.595e-01 5.839## poly(income, degree = 3, raw = TRUE)2 -9.581e-02 3.736e-02 -2.564## poly(income, degree = 3, raw = TRUE)3 6.855e-04 4.720e-04 1.452## Pr(>|t|) ## (Intercept)
# demo the hypothesis using robust standard errorscoeftest(cubic_mã sản phẩm, vcov. = vcovHC, type = "HC1")
## ## t thử nghiệm of coefficients:## ## Estimate Std. Error t value## (Intercept) 6.0008e+02 5.1021e+00 117.6150## poly(income, degree = 3, raw = TRUE)1 5.0187e+00 7.0735e-01 7.0950## poly(income, degree = 3, raw = TRUE)2 -9.5805e-02 2.8954e-02 -3.3089## poly(income, degree = 3, raw = TRUE)3 6.8549e-04 3.4706e-04 1.9751## Pr(>|t|) ## (Intercept) lúc thực hiện khoảng chừng vững, ta thấy tác dụng tất cả sự biến hóa ở tại mức ý nghĩa của hệ số biến hóa bậc 3. Điều này còn có nghĩa ta bác bỏ vứt giả tngày tiết (H_0) hàm hồi quy là bậc nhị với (H_A) hàm hồi quy bậc tía trên nút ý nghĩa sâu sắc (5\%).


11.2.2 Giải ưng ý thông số hồi quy

Chẳng hạn quy mô hồi quy bao gồm dạng

Vậy nên Lúc tăng thu nhập cá nhân tự (10) lên (11) thì điểm thi tăng (2.96) điểm, tuy vậy lúc thu nhập tăng tự (40) lên (41) thì điểm thi chỉ tăng (0.42). Cho thấy độ nghiêng của hàm hồi quy dốc hơn ở mức thu nhập thấp cùng thoải hơn tại mức các khoản thu nhập cao.


# compute and assign the quadratic modelquadriatic_Model lm(score ~ income + I(income^2), data = CASchools)# set up data for predictionnew_data data.frame(income = c(10, 11))# vì the predictionY_hat predict(quadriatic_mã sản phẩm, newdata = new_data)# compute the differencediff(Y_hat)
## 2 ## 2.962517

11.2.3 Hàm Logarithms

Một bí quyết không giống nhằm quy cách hàm số phi con đường là sử dụng hàm lograthims lên đổi mới (Y) hoặc/và (X). Chuyển hàm logarithms biến đổi những thay đổi thanh lịch Tỷ Lệ đổi khác. Có các cách để kiến thiết mô hình Theo phong cách tiếp cận logarithm.

Trường hợp 1: logarithm (X)

Mô hình trsinh hoạt thành:


# estimate a level-log modelLinearLog_mã sản phẩm lm(score ~ log(income), data = CASchools)# compute robust summarycoeftest(LinearLog_Model, vcov = vcovHC, type = "HC1")
## ## t kiểm tra of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 557.8323 3.8399 145.271 Ta vẽ mặt đường hồi quy hệt như sau.


# draw a scatterplotplot(score ~ income, col = "steelblue", pch = 20, data = CASchools, main = "Linear-Log Regression Line")# add the linear-log regression lineorder_id order(CASchools$income)lines(CASchools$income, fitted(LinearLog_model), col = "red", lwd = 2)

*

Ta rất có thể lý giải (hateta_1) như sau. (1\%) lớn mạnh thu nhập cá nhân thì điểm thi tăng (0.01 imes 36.42 = 0.36) điểm.

Trường thích hợp 2: logarithm (Y)

Mô hình trong trường thích hợp nàgiống hệt như sau.


# estimate a log-linear model LogLinear_mã sản phẩm lm(log(score) ~ income, data = CASchools)# obtain a robust coefficient summarycoeftest(LogLinear_model, vcov = vcovHC, type = "HC1")
## ## t test of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 6.43936234 0.00289382 2225.210 lúc các khoản thu nhập tăng 1 đơn vị thu nhập cá nhân, điểm thi tăng ((100 imes 0.00284)\% = 0.284\%).

khi sử dụng hàm đưa dạng mang lại đổi thay (Y) ta yêu cầu cẩn thận. Mô hình hồi quy sẽ cho ta khoảng chừng của (ln(Y)), một phương pháp thường thì, ta có thể đưa về (hatY) bằng hàm exp(). lúc đó, quy mô tất cả dạng:

Từ kia, ta có:

Vì (E(u_i|X_i)=0) buộc phải (E(e^u_i|X_i) = 1), nói theo cách khác, (E(e^u_i|X_i) e 0). Do đó khoảng chừng (hatY = e^hateta_0 + hateta_1X_i) có khả năng sẽ bị thiên lệch vì chưng thiếu hụt mất thành tố (E(e^u_i|X_i)). Hình vẽ sau đây đã biểu hiện sự thiên lệch này.


# draw a scatterplotorder_id order(CASchools$income)par(mfrow = c(1,2))plot(score ~ income, col = "steelblue", pch = đôi mươi, data = CASchools, main = "Regression Line with Log Transformation")abline(linear_model, col = "black", lwd = 2)# add the linear-log regression linelines(CASchools$income, exp(fitted(LogLinear_model)), col = "red", lwd = 2)# draw with different y-axisplot(log(score) ~ income, col = "steelblue", pch = 20, data = CASchools, main = "Log-Linear Regression Function")lines(CASchools$income, fitted(LogLinear_model), col = "red", lwd = 2)

*

Một phương pháp giải quyết đó là nỗ lực khoảng chừng thành tố thiếu thốn (E(e^u_i|X_i)). Tuy nhiên giả dụ (u_i) bao gồm hiện tượng kỳ lạ heteroskedasticity thì việc ước chừng càng phức tạp hơn.

Một biện pháp xử lý không giống đó là giữ nguyên (ln(Y)). Trong tài chính, điều đó hoàn toàn có thể gật đầu được Khi so với tình tiết giá chỉ gia sản, tức là phiên phiên bản (ln(Y)) tất cả ý nghĩa kinh tế tài chính.

Trường phù hợp 2: logarithm (X) và (Y)

Hồi quy log-log gồm dạng nhỏng sau


# estimate the log-log modelLogLog_mã sản phẩm lm(log(score) ~ log(income), data = CASchools)# print robust coefficient summary to the consolecoeftest(LogLog_Mã Sản Phẩm, vcov = vcovHC, type = "HC1")

# generate a scatterplotplot(log(score) ~ income, col = "steelblue", pch = trăng tròn, data = CASchools, main = "Log-Linear Regression Function")# add the log-linear regression lineorder_id order(CASchools$income)# add the log-log regression linelines(sort(CASchools$income), fitted(LogLog_model), col = "red", lwd = 2)

*

Ta hoàn toàn có thể mở rộng đổi khác logarithms bằng cách kết hợp với nhiều thức, ta gồm hàm polylog, chẳng hạn như sau.

< extĐiểm thi_i = eta_0 + eta_1 ln( extThu nhập_i) + eta_2 ln( extThu nhập_i)^2 + eta_3 ln( extThu nhập_i)^3 + u_i>


# estimate the polylog modelpolyLog_mã sản phẩm lm(score ~ log(income) + I(log(income)^2) + I(log(income)^3), data = CASchools)# print robust summary to lớn the consolecoeftest(polyLog_mã sản phẩm, vcov = vcovHC, type = "HC1")

# compute the adj. R^2 for the nonlinear modelsadj_R2 rbind("Quadratic" = summary(quadratic_model)$adj.r.squared, "Cubic" = summary(cubic_model)$adj.r.squared, "LinearLog" = summary(LinearLog_model)$adj.r.squared, "LogLinear" = summary(LogLinear_model)$adj.r.squared, "LogLog" = summary(LogLog_model)$adj.r.squared, "PolyLog" = summary(polyLog_model)$adj.r.squared)

Adjusted (R^2)
Quadratic0.5540444
Cubic0.5552279
LinearLog0.5614605
LogLinear0.4970106
LogLog0.5567251
PolyLog0.5599944
Ta thấy các thông số (R^2) hiệu chỉnh sát giao động nhau. Ta rất có thể đối chiếu thứ thị của các quy mô này, chẳng hạn như sau.


# generate a scatterplotplot(score ~ income, data = CASchools, col = "steelblue", pch = 20, main = "Linear-Log & Cubic Regression Functions")# add the linear-log regression lineorder_id order(CASchools$income)lines(CASchools$income, fitted(LinearLog_model), col = "darkgreen", lwd = 2)# add the cubic regression linelines(x = CASchools$income, y = fitted(cubic_model), col = "darkred", lwd = 2)

*

Cả hai đường hầu hết gần như nhau. Tuy nhiên ta thấy mô hình linear-log được ưu tiên rộng bởi vì không nhiều tyêu thích số hơn, ta ko có nhu cầu các hàm bậc cao.


11.3 Sự liên tưởng thân những trở nên độc lập

Có những sự việc trong thực tiễn tương quan mang đến ảnh hưởng lên trở nên (Y) của sự việc biến đổi một đổi mới (X_i) lại phụ thuộc vào vào quý hiếm của một biến hóa (X_j) ((j e i)) khác. Chẳng hạn, liệu các khu vực những học viên học tiếng Anh đã có được lợi gì về khía cạnh điểm số không từ việc giảm bài bản lớp học. Ttốt vì chưng câu hỏi hồi quy thông thường: điểm số có khả năng sẽ bị ảnh hưởng tác động như thế nào giả dụ sút bài bản lớp học. Để đánh giá vụ việc này, ta nên chế tạo mô hình một sự tác động thân các đổi mới (X).

Ta xét tía ngôi trường hợp:

sự shop thân nhì biến hóa nhị phân.sự can dự thân một phát triển thành nhị phân với một vươn lên là liên tiếp.sự liên tưởng giữa nhì trở thành thường xuyên.

Xem thêm: Budget Hotel Là Gì - Lợi Thế Cạnh Tranh Của Mô Hình Budget Hotel


11.3.1 Sự liên tưởng giữa hai biến nhị phân

Mô hình tất cả dạng

Giả sử:

<eginaligned Y_i &= ln( extThu nhập)_i \ D_1i &= egincases 1 ext ví như fan đồ vật i gồm bởi cao đẳng \ 0 endcases \ D_2i &= egincases 1 ext ví như người trang bị i là nữ \ 0 endcases endaligned>

Ta biết rằng (eta_1) đo lường và thống kê sự biệt lập trong logarithm thu nhập cá nhân vừa đủ thân hai đội người có bằng cao đẳng cùng người không, còn (eta_2) giám sát sự biệt lập trong logarithm thu nhập cá nhân trung bình thân phái mạnh và thiếu nữ. Tuy nhiên quy mô này không được cho phép ta nhận xét sự ảnh hưởng của một người dân có Đặc điểm của cả (D_1) cùng (D_2). Do kia ta điều chỉnh mô hình lời khuyên thành:

(D_1i imes D_2i) được điện thoại tư vấn là đổi mới địa chỉ. Ta thấy:

<eginaligned &E(Y_i|D_1i = 0, D_2i= d_2) = eta_0 + eta_2 imes d_2 \ &E(Y_i|D_1i = 1, D_2i= d_2) = eta_0 +eta_1+eta_2 imes d_2 +eta_3 imes d_2 \&E(Y_i|D_1i = 1, D_2i= d_2) -E(Y_i|D_1i = 0, D_2i= d_2) = eta_1+eta_3 imes d_2 endaligned>

<eginaligned &E(Y_i|D_1i = d_1, D_2i= 0) = eta_0 + eta_1 imes d_1 \ &E(Y_i|D_1i = d_1, D_2i= 1) = eta_0 +eta_1 imes d_1+eta_2 +eta_3 imes d_1 \&E(Y_i|D_1i = d_1, D_2i= 1) -E(Y_i|D_1i = d_1, D_2i= 0) = eta_2+eta_3 imes d_1 endaligned>

Theo đó ta sẽ giải thích được chân thành và ý nghĩa thông số (eta_3).

Trong R, ta điều tra khảo sát sự shop thân phát triển thành STR và PctEL. Đặt:

<eginaligned &HiSTR = egincases 1 ext nếu STR ge đôi mươi \ 0 endcases \ &HiEL = egincases 1 ext trường hợp PctEL ge 10 \ 0 endcases endaligned>


# appkết thúc HiSTR to lớn CASchoolsCASchools$HiSTR as.numeric(CASchools$form size >= 20)# appover HiEL khổng lồ CASchoolsCASchools$HiEL as.numeric(CASchools$english >= 10)
Ta ước chừng mô hình.


# estimate the Model with a binary interaction termbi_model lm(score ~ HiSTR * HiEL, data = CASchools)# print a robust summary of the coefficientscoeftest(bi_Mã Sản Phẩm, vcov. = vcovHC, type = "HC1")
## ## t demo of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 664.1433 1.3881 478.4589

11.3.2 Sự liên quan giữa một thay đổi thường xuyên và biến nhị phân

Đặt (X_i) diễn đạt thời gian tay nghề của người lắp thêm (i), là biến hóa bất chợt thường xuyên. Ta chuyển biến (D_1i) thành vươn lên là (D_i). Mô hình bắt đầu đề xuất:

Ta chế tạo ảnh hưởng liên hệ bằng cách thêm phát triển thành ((X_i imes D_i)) vào quy mô. Như vậy đã làm độ nghiêng mặt đường hồi quy phụ thuộc vào trở nên (D_i). Có bố trường hợp:

cùng độ nghiêng mà lại khác intercept: (Y_i = eta_0 + eta_1 X_i + eta_2 D_i + u_i)thuộc intercept nhưng mà không giống độ nghiêng: (Y_i = eta_0 + eta_1 X_i + eta_2 (X_i imes D_i) + u_i)khác intercept khác độ nghiêng: (Y_i = eta_0 + eta_1 X_i + eta_2 D_i + eta_3 (X_i imes D_i) u_i)

# generate artificial datamix.seed(1)X runif(200,0, 15)D sample(0:1, 200, replace = T)Y 450 + 150 * X + 500 * D + 50 * (X * D) + rnorm(200, sd = 300)# divide plotting area accordinglym rbind(c(1, 2), c(3, 0))graphics::layout(m)# estimate the models & plot the regression lines# 1. (baseline model)plot(X, log(Y), pch = đôi mươi, col = "steelblue", main = "Different Intercepts, Same Slope")mod1_coef lm(log(Y) ~ X + D)$coefficientsabline(coef = c(mod1_coef<1>, mod1_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod1_coef<1> + mod1_coef<3>, mod1_coef<2>), col = "green", lwd = 1.5) # 2. (baseline Mã Sản Phẩm + interaction term)plot(X, log(Y), pch = 20, col = "steelblue", main = "Different Intercepts, Different Slopes")mod2_coef lm(log(Y) ~ X + D + X:D)$coefficientsabline(coef = c(mod2_coef<1>, mod2_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod2_coef<1> + mod2_coef<3>, mod2_coef<2> + mod2_coef<4>), col = "green", lwd = 1.5)# 3. (omission of D as regressor + interaction term)plot(X, log(Y), pch = 20, col = "steelblue", main = "Same Intercept, Different Slopes")mod3_coef lm(log(Y) ~ X + X:D)$coefficientsabline(coef = c(mod3_coef<1>, mod3_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod3_coef<1>, mod3_coef<2> + mod3_coef<3>), col = "green", lwd = 1.5)

*

Ta vận dụng trong R bằng phương pháp Đánh Giá tương tác thân kích thước và HiEL theo phương thức thứ tía.


# estimate the modelbci_Model lm(score ~ form size + HiEL + size * HiEL, data = CASchools)# print robust summary of coefficients khổng lồ the consolecoeftest(bci_Mã Sản Phẩm, vcov. = vcovHC, type = "HC1")
# identify observations with PctEL >= 10id CASchools$english >= 10# plot observations with HiEL = 0 as red dotsplot(CASchools$size, CASchools$score, xllặng = c(0, 27), ylim = c(600, 720), pch = đôi mươi, col = "red", main = "", xlab = "Class Size", ylab = "Test Score")# plot observations with HiEL = 1 as green dotspoints(CASchools$size, CASchools$score, pch = 20, col = "green")# read out estimated coefficients of bci_modelcoefs bci_model$coefficients# draw the estimated regression line for HiEL = 0abline(coef = c(coefs<1>, coefs<2>), col = "red", lwd = 1.5)# draw the estimated regression line for HiEL = 1abline(coef = c(coefs<1> + coefs<3>, coefs<2> + coefs<4>), col = "green", lwd = 1.5 )# add a legkết thúc to the plotlegend("topright", pch = c(đôi mươi, 20), col = c("red", "green"), legkết thúc = c("HiEL = 0", "HiEL = 1"))

*


11.3.3 Sự ảnh hưởng giữa hai thay đổi liên tục

Sự xúc tiến thân nhị đổi thay liên tục (X_1) cùng (X_2) được Reviews trải qua (X_1 imes X_2). Khi kia, mô hình trngơi nghỉ thành:

Đánh giá đạo hàm theo (X_1) cùng (X_2) ta sẽ có:

Áp dụng vào R, ta Đánh Giá form size cùng english.


# estimate regression Mã Sản Phẩm including the interaction between 'PctEL' và 'size'cci_model lm(score ~ size + english + english * kích thước, data = CASchools) # print a summary khổng lồ the consolecoeftest(cci_model, vcov. = vcovHC, type = "HC1")
## ## t test of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 686.3385268 11.7593466 58.3654

11.3.4 Phân tích dữ liệu Cầu Economic Journals

Trong phần này, ta đối chiếu tài liệu Journals trong package AER, tất cả những quan tiền ngay cạnh của 180 tập san kỹ thuật trong năm 2000. Ta giám sát giá tiền cho mỗi citation cùng tính toán tuổi của journal cùng số lượng ký kết từ bỏ cho mỗi journal.


data("Journals")# define and rename variablesJournals$PricePerCitation Journals$price/Journals$citationsJournals$Age 2000 - Journals$foundingyearJournals$Characters Journals$charpp * Journals$pages/10^6Journals$Subscriptions Journals$subs
Vùng quý giá của PricePerCitation hơi rộng lớn và trang trải.


# compute summary statistics for price per citationsummary(Journals$PricePerCitation)
(ln (Subscriptions_i) = eta_0 + eta_1 ln (PricePerCitation_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_4ln(Age_i) + eta_6 ln(Characters_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_2 ln(PricePerCitation_i)^2+eta_3 ln(PricePerCitation_i)^3 + eta_4ln(Age_i) + eta_5 + eta_6 ln(Characters_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_4ln(Age_i) +eta_5+ eta_6 ln(Characters_i) + u_i)

# Estimate models (I) - (IV)Journals_mod1 lm(log(Subscriptions) ~ log(PricePerCitation), data = Journals)Journals_mod2 lm(log(Subscriptions) ~ log(PricePerCitation) + log(Age) + log(Characters), data = Journals)Journals_mod3 lm(log(Subscriptions) ~ log(PricePerCitation) + I(log(PricePerCitation)^2) + I(log(PricePerCitation)^3) + log(Age) + log(Age):log(PricePerCitation) + log(Characters), data = Journals)Journals_mod4 lm(log(Subscriptions) ~ log(PricePerCitation) + log(Age) + log(Age):log(PricePerCitation) + log(Characters), data = Journals)
Sử dụng summary() ta đã đạt được kết quả sau.

(ln (hatSubscriptions_i) = 4.77 - 0.53 ln (PricePerCitation_i))(eginalignedln (hatSubscriptions_i) = &3.21 - 0.41 ln(PricePerCitation_i) + 0.42ln(Age_i) \&+ 0.21 ln(Characters_i) endaligned)(eginalignedln (hatSubscriptions_i) = &3.41 -0.96 ln(PricePerCitation_i) + 0.02 ln(PricePerCitation_i)^2\&+0.004 ln(PricePerCitation_i)^3 + 0.37ln(Age_i) \&+ 0.16 + 0.23 ln(Characters_i)endaligned)(eginalignedln (hatSubscriptions_i) = &3.43 -0.90 ln(PricePerCitation_i) + 0.37ln(Age_i) \&+0.14+ 0.23 ln(Characters_i)endaligned)

Ta rất có thể sử dụng chu chỉnh (F) để kiểm tra quy giải pháp polylog so với trở thành (ln(PricePerCitation_i)).


# F-Test for significance of cubic termslinearHypothesis(Journals_mod3, c("I(log(PricePerCitation)^2)=0", "I(log(PricePerCitation)^3)=0"), vcov. = vcovHC, type = "HC1")
## Linear hypothesis test## ## Hypothesis:## I(log(PricePerCitation)^2) = 0## I(log(PricePerCitation)^3) = 0## ## Model 1: restricted model## Model 2: log(Subscriptions) ~ log(PricePerCitation) + I(log(PricePerCitation)^2) + ## I(log(PricePerCitation)^3) + log(Age) + log(Age):log(PricePerCitation) + ## log(Characters)## ## Note: Coefficient covariance matrix supplied.## ## Res.Df Df F Pr(>F)## 1 175 ## 2 173 2 0.1943 0.8236Ta không thể chưng bỏ (H_0:eta_3 = eta_4 = 0) đối với quy mô (III). Kết quả quy mô được biểu hiện trong bảng sau đây.

log(Subscriptions)
(I)(II)(III)(IV)
(1)(2)(3)(4)
log(PricePerCitation)-0.533***-0.408***-0.961***-0.899***
(0.034)(0.044)(0.160)(0.145)
I(log(PricePerCitation)2)0.017
(0.025)
I(log(PricePerCitation)3)0.004
(0.006)
log(Age)0.424***0.373***0.374***
(0.119)(0.118)(0.118)
log(Characters)0.206**0.235**0.229**
(0.098)(0.098)(0.096)
log(PricePerCitation):log(Age)0.156***0.141***
(0.052)(0.040)
Constant4.766***3.207***3.408***3.434***
(0.055)(0.380)(0.374)(0.367)
Observations180180180180
R20.5570.6130.6350.634
Adjusted R20.5550.6070.6220.626
Residual Std. Error0.750 (df = 178)0.705 (df = 176)0.691 (df = 173)0.688 (df = 175)
F Statistic224.037*** (df = 1; 178)93.009*** (df = 3; 176)50.149*** (df = 6; 173)75.749*** (df = 4; 175)
Notes:***Significant at the 1 percent màn chơi.
**Significant at the 5 percent màn chơi.
*Significant at the 10 percent level.

Hình hoạ những quy mô nlỗi sau.


# divide plotting aream rbind(c(1, 2), c(3, 0))graphics::layout(m)# scatterplotplot(Journals$PricePerCitation, Journals$Subscriptions, pch = đôi mươi, col = "steelblue", ylab = "Subscriptions", xlab = "ln(Price per ciation)", main = "(a)")# log-log scatterplot và estimated regression line (I)plot(log(Journals$PricePerCitation), log(Journals$Subscriptions), pch = đôi mươi, col = "steelblue", ylab = "ln(Subscriptions)", xlab = "ln(Price per ciation)", main = "(b)")abline(Journals_mod1, lwd = 1.5)# log-log scatterplot and regression lines (IV) for Age = 5 and Age = 80plot(log(Journals$PricePerCitation), log(Journals$Subscriptions), pch = đôi mươi, col = "steelblue", ylab = "ln(Subscriptions)", xlab = "ln(Price per ciation)", main = "(c)")JM4C $coefficients# Age = 80abline(coef = c(JM4C<1> + JM4C<3> * log(80), JM4C<2> + JM4C<5> * log(80)), col = "darkred", lwd = 1.5)# Age = 5abline(coef = c(JM4C<1> + JM4C<3> * log(5), JM4C<2> + JM4C<5> * log(5)), col = "darkgreen", lwd = 1.5)

*

Những Kết luận rất có thể được rút ít ra:

Cầu của tạp chí giãn nở các so với những tập san tphải chăng tuổi.Việc ko bác bỏ vứt (H_0) của chu chỉnh (F) so với mô hình (III) thống tốt nhất với quan hệ nam nữ tuyến tính giữa log(subscriptions) và log(price).Cầu cao hơn so với tập san nhiều cam kết tự, với giá cùng tuổi không thay đổi.

Cầu tập san phi co giãn với giá: ta thấy mô hình (IV), kể cả tạp chí trẻ tuổi ((Age=5)) ta thấy ước tính độ co và giãn giá (-0.899+0.374 imes ln(5)+ 0.141 imes approx -0.3), tức là một trong những phần trăm đội giá dẫn đến cầu sút chỉ (0.3) Phần Trăm. Kết quả này không tồn tại gì không thể tinh được vì nguồn tiêu thụ đầu ra output của các tạp chí hay là những tlỗi viện.


11.4 Bài tập


11.4.1 Bài 1: Hệ số tương quan cùng Phi đường 1

Xem xét mô hình đơn giản:

với (medv) là trung vị giá cả nhà đất với (lstat) là xác suất hộ mái ấm gia đình với chứng trạng kinh tế tốt, trong cỗ tài liệu Boston.

Tính thông số đối sánh giữa (medv) với (lstat) cùng giữ vào biến chuyển corr.Đồ thị hoá medv cùng lstat và tiếp tế đường hồi quy mod. Nhận xét.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiJkYXRhKFwiQm9zdG9uXCIpXG5tb2QgPC0gbG0obWVkdiB+IGxzdGF0ICwgZGF0YSA9IEJvc3RvbilcbiMgY29tcHV0ZSB0aGUgY29ycmVsYXRpb24gYmV0d2VlbiBtZWR2IGFuZCBsc3RhdFxuXG5cbiMgcGxvdCBtZWR2IGFnYWluc3QgbHN0YXQgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lIiwic29sdXRpb24iOiIjIGNvbXB1dGUgdGhlIGNvcnJlbGF0aW9uIGJldHdlZW4gbWVkdiBhbmQgbHN0YXRcbmNvcnIgPC0gY29yKEJvc3RvbiRtZWR2LCBCb3N0b24kbHN0YXQpXG5cbiMgcGxvdCBtZWR2IGFnYWluc3QgbHN0YXQgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lXG5wbG90KG1lZHYgfiBsc3RhdCwgZGF0YSA9IEJvc3RvbilcbmFibGluZShyZWcgPSBtb2QsIGNvbCA9IFwicmVkXCIpIn0=

11.4.2 Bài 2: Hệ số đối sánh và Phi con đường 2

Ta để ý quan hệ sau đây.

Thực hiện tại hồi quy và lưu trữ vào phát triển thành log_gian lận.Mô tả điểm rải cùng cấp dưỡng đường hồi quy. So sánh cùng với kết quả bài trước.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfbG9nXG5cblxuIyBkcmF3IGEgc2NhdHRlcnBsb3QgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lIiwic29sdXRpb24iOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfbG9nXG5tb2RfbG9nIDwtIGxtKG1lZHYgfiBsb2cobHN0YXQpLCBkYXRhID0gQm9zdG9uKVxuXG4jIGRyYXcgYSBzY2F0dGVycGxvdCBhbmQgYWRkIHRoZSByZWdyZXNzaW9uIGxpbmVcbnBsb3QobWVkdiB+IGxvZyhsc3RhdCksIGRhdGEgPSBCb3N0b24pXG5hYmxpbmUobW9kX2xvZywgY29sID0gXCJyZWRcIikifQ==

11.4.3 Bài 3: Bậc nhiều thức tối ưu

Ta thấy sinh hoạt bài tập trước quy phương pháp (medv_i = eta_0 + eta_1 imes log(lstat_i) + u_i) là một trong những sự chắt lọc phải chăng. Tuy nhiên, đa thức bậc cao so với (log(lstat_i)) rất có thể phù hợp hơn.

Giả sử bậc cao nhất cẩn thận là (r=4), áp dụng for() để chọn ra bậc buổi tối ưu Theo phong cách sau đây.

Ước lượng mô hình, gian lận, bắt đầu trường đoản cú (r=4).Lưu biến đổi (p)-value vững vàng của các tđê mê số tương quan cùng đối chiếu với mức chân thành và ý nghĩa (0.05).Nếu tất yêu bác bỏ bỏ mô hình, lặp lại bước (i) và (ii) đối với bậc rẻ hơn.Dừng lại cho đến lúc lựa chọn ra được bậc về tối ưu.

Tính (R^2) của mô hình được lựa chọn với phân bổ vào R2.


eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGZpbmQgdGhlIG9wdGltYWwgcG9seW5vbWlhbCBvcmRlciBvZiB0aGUgcG9seWxvZyBtb2RlbFxuXG5cblxuXG5cblxuXG5cblxuIyBleHRyYWN0IHRoZSBSXjIgZnJvbSB0aGUgc2VsZWN0ZWQgbW9kZWwgYW5kIGFzc2lnbiBpdCB0byBSMiIsInNvbHV0aW9uIjoiIyBmaW5kIHRoZSBvcHRpbWFsIHBvbHlub21pYWwgb3JkZXIgb2YgdGhlIHBvbHlsb2cgbW9kZWxcbmZvcihpIGluIDQ6MSl7XG5tb2QgIDwtIGxtKG1lZHYgfiBwb2x5KGxvZyhsc3RhdCksIGksIHJhdyA9IFQpLCBkYXRhID0gQm9zdG9uKVxucHZhbCA8LSBjb2VmdGVzdChtb2QsIHZjb3YgPSB2Y292SEMpWyhpKzEpLCA0XVxuaWYocHZhbCA8IDAuMDUpe1xuICBwcmludChpKVxuICBicmVha1xuICB9XG59XG5cbiMgZXh0cmFjdCB0aGUgUl4yIGZyb20gdGhlIHNlbGVjdGVkIG1vZGVsIGFuZCBhc3NpZ24gaXQgdG8gUjJcblIyIDwtIHN1bW1hcnkobW9kKSRyLnNxdWFyZWQifQ==

11.4.4 Bài 4: Tương tác thân những biến hóa độc lập 1

Xem quy mô hồi quy

trong số ấy (chas_i) cùng (old_i) là các biến đổi mang. Đối cùng với vươn lên là đầu, với giá trị (1) nếu sông Charles (một dòng sông kề bên Boston) đi qua khu vực vự (i), trở nên sau mang cực hiếm (1) nếu như (age ge 95).

Tạo lập đổi thay trả old.Thực hiện hồi quy trong mod_bb.Tổng hòa hợp hệ số hồi quy vững.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGdlbmVyYXRlIHRoZSBiaW5hcnkgdmFyaWFibGUgYG9sZGAgYW5kIGFwcGVuZCBpdCB0byB0aGUgZGF0YXNldFxuXG5cbiMgY29uZHVjdCB0aGUgcmVncmVzc2lvbiBhbmQgYXNzaWduIGl0IHRvIGBtb2RfYmJgXG5cblxuIyBwcmludCBhIHJvYnVzdCBzdW1tYXJ5IHRvIHRoZSBjb25zb2xlIiwic29sdXRpb24iOiIjIGdlbmVyYXRlIHRoZSBiaW5hcnkgdmFyaWFibGUgYG9sZGAgYW5kIGFwcGVuZCBpdCB0byB0aGUgZGF0YXNldFxuQm9zdG9uJG9sZCA8LSBhcy5udW1lcmljKEJvc3RvbiRhZ2UgPj0gOTUpXG5cbiMgY29uZHVjdCB0aGUgcmVncmVzc2lvbiBhbmQgYXNzaWduIGl0IHRvIGBtb2RfYmJgXG5tb2RfYmIgPC0gbG0obWVkdiB+IGNoYXMqb2xkLCBkYXRhID0gQm9zdG9uKVxuXG4jIHByaW50IGEgcm9idXN0IHN1bW1hcnkgdG8gdGhlIGNvbnNvbGVcbmNvZWZ0ZXN0KG1vZF9iYiwgdmNvdi4gPSB2Y292SEMpIn0=

11.4.5 Bài 5: Tương tác thân các trở nên độc lập 2

Bây tiếng chăm chú mô hình hồi quy

Dùng ?Boston nhằm tham khảo chân thành và ý nghĩa các vươn lên là trong quy mô. Biến old đã có được append vào cỗ dữ liệu Boston.

Xem thêm: Cách Bật Chế Độ Công Khai Trên Facebook, Hướng Dẫn Bật Công Khai

Ước lượng mô hình hồi quy cùng lưu vào trở thành mod_bc.Lấy các hệ số hồi quy lưu lại vào vươn lên là params.Vẽ đường hồi quy medv và indus cho nhì ngôi trường thích hợp của old.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfYmMuXG5cblxuIyBleHRyYWN0IHRoZSBlc3RpbWF0ZWQgbW9kZWwgY29lZmZpY2llbnRzIGFuZCBhc3NpZ24gdGhlbSB0byBwYXJhbXMuXG5cblxuIyBwbG90IG1lZHYgYWdhaW5zdCBpbmR1cyBhbmQgYWRkIHRoZSByZWdyZXNzaW9uIGxpbmVzLiIsInNvbHV0aW9uIjoiIyBjb25kdWN0IHRoZSByZWdyZXNzaW9uIGFuZCBhc3NpZ24gaXQgdG8gbW9kX2JjLlxubW9kX2JjIDwtIGxtKG1lZHYgfiBpbmR1cypvbGQsIGRhdGEgPSBCb3N0b24pXG5cbiMgZXh0cmFjdCB0aGUgZXN0aW1hdGVkIG1vZGVsIGNvZWZmaWNpZW50cyBhbmQgYXNzaWduIHRoZW0gdG8gcGFyYW1zLlxucGFyYW1zIDwtIGNvZWYobW9kX2JjKVxuXG4jIHBsb3QgbWVkdiBhZ2FpbnN0IGluZHVzIGFuZCBhZGQgdGhlIHJlZ3Jlc3Npb24gbGluZXMuXG5wbG90KG1lZHYgfiBpbmR1cywgZGF0YSA9IEJvc3RvbilcbmFibGluZShhID0gcGFyYW1zWzFdLCBiID0gcGFyYW1zWzJdLCBjb2wgPSBcInJlZFwiKVxuYWJsaW5lKGEgPSBwYXJhbXNbMV0gKyBwYXJhbXNbM10sIGIgPSBwYXJhbXNbMl0gKyBwYXJhbXNbNF0sIGNvbCA9IFwiZGFya2JsdWVcIikifQ==

Chuyên mục: kiến thức