最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R語言中回歸模型預(yù)測的不同類型置信區(qū)間應(yīng)用比較分析

2021-04-12 09:04 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=13913?

?

?

我們討論了使用程序來獲得預(yù)測的置信區(qū)間的方法。我們將討論線性回歸。

?

  1. > plot(cars)

  2. > reg=lm(dist~speed,data=cars)

  3. > abline(reg,col="red")

  4. > n=nrow(cars)

  5. > x=21

  6. > points(x,predict(reg,newdata= data.frame(speed=x)),pch=19,col="red")

?

我們正在這里做出一個預(yù)測。正如在R課堂上(以及在預(yù)測模型的過程中)所回顧的,當(dāng)我們要為預(yù)測提供一個置信區(qū)間時,建議您為預(yù)測器確定置信區(qū)間(這將取決于預(yù)測誤差)參數(shù)的估計)和潛在值的置信區(qū)間(這也取決于模型誤差,即殘差的離散度)。讓我們從預(yù)測的置信區(qū)間開始:


  1. abline(reg,col="light blue")

  2. points(x,predict(reg,newdata=data.frame(speed=x)),pch=19,col="blue")

藍(lán)色值是可能的預(yù)測,可以通過在我們的觀察數(shù)據(jù)庫中重新采樣獲得。殘差(以及因此的斜率和回歸線的常數(shù)的估計值)的正態(tài)性假設(shè)下的置信區(qū)間(為90%)如下


  1. lines(0:30,U[,2],col="red",lwd=2)

  2. lines(0:30,U[,3],col="red",lwd=2)

?

我們可以在這里比較在500個生成的數(shù)據(jù)集上獲得的值的分布,并比較經(jīng)驗分位數(shù)和假設(shè)正態(tài)性下的分位數(shù),

polygon(c(D$x[I],rev(D$x[I])),c(D$y[I],rep(0,length(I))),col="blue",border=NA)

數(shù)量比較

  1. 5% ? ? ?95%

  2. 58.63689 70.31281

  3. fit ? ? ?lwr ? ? ?upr

  4. 65.00149 59.65934 70.34364

現(xiàn)在,讓我們來看另一種類型的置信區(qū)間,即關(guān)注變量的可能值。這次,除了繪制新樣本和計算預(yù)測值之外,我們還將在每次繪制中添加噪聲,我們獲得可能的值。

points(x,Yx[s],pch=19,col="red")

?

同樣,在這里,我們可以比較(以圖形方式開始)通過重采樣獲得的值,以及在正常情況下獲得的值,

polygon(c(D$x[I],rev(D$x[I])),c(D$y[I],rep(0,length(I))),col="blue",border=NA)

?

從數(shù)字上給出以下比較

  1. 5% ? ? ?95%

  2. 44.43468 96.01357

  3. fit ? ? ?lwr ? ? ?upr

  4. 1 67.63136 45.16967 90.09305

這次右側(cè)略有不對稱。顯然,我們不能假設(shè)高斯殘差,因為正值比負(fù)值大??紤]到數(shù)據(jù)的性質(zhì)(距離不能為負(fù)),這是合理的。

然后,我們開始討論使用回歸模型。

  1. [,1] [,2] [,3] [,4] [,5] [,6]

  2. [1,] 3209 4372 4411 4428 4435 4456

  3. [2,] 3367 4659 4696 4720 4730 ? NA

  4. [3,] 3871 5345 5398 5420 ? NA ? NA

  5. [4,] 4239 5917 6020 ? NA ? NA ? NA

  6. [5,] 4929 6794 ? NA ? NA ? NA ? NA

  7. [6,] 5217 ? NA ? NA ? NA ? NA ? NA

  8. [,1] [,2] [,3] [,4] [,5] [,6]

  9. [1,] 3209 1163 ? 39 ? 17 ? ?7 ? 21

  10. [2,] 3367 1292 ? 37 ? 24 ? 10 ? NA

  11. [3,] 3871 1474 ? 53 ? 22 ? NA ? NA

  12. [4,] 4239 1678 ?103 ? NA ? NA ? NA

  13. [5,] 4929 1865 ? NA ? NA ? NA ? NA

  14. [6,] 5217 ? NA ? NA ? NA ? NA ? NA

然后,我們可以建立一個數(shù)據(jù)。


  1. > head(base,12)

  2. y ? ai bj

  3. 1 ?3209 2000 ?0

  4. 2 ?3367 2001 ?0

  5. 3 ?3871 2002 ?0

  6. 4 ?4239 2003 ?0

  7. 5 ?4929 2004 ?0

  8. 6 ?5217 2005 ?0

  9. 7 ?1163 2000 ?1

  10. 8 ?1292 2001 ?1

  11. 9 ?1474 2002 ?1

  12. 10 1678 2003 ?1

  13. 11 1865 2004 ?1

  14. 12 ? NA 2005 ?1

  15. > tail(base,12)

  16. y ? ai bj

  17. 25 ?7 2000 ?4

  18. 26 10 2001 ?4

  19. 27 NA 2002 ?4

  20. 28 NA 2003 ?4

  21. 29 NA 2004 ?4

  22. 30 NA 2005 ?4

  23. 31 21 2000 ?5

  24. 32 NA 2001 ?5

  25. 33 NA 2002 ?5

  26. 34 NA 2003 ?5

  27. 35 NA 2004 ?5

  28. 36 NA 2005 ?5

然后,我們可以使用基于?Stavros Christofides的對數(shù)增量支付模型的回歸模型,該模型基于對數(shù)正態(tài)模型,該模型最初由Etienne de Vylder于1978年提出。


  1. Residuals:

  2. Min ? ? ? 1Q ? Median ? ? ? 3Q ? ? ?Max

  3. -0.26374 -0.05681 ?0.00000 ?0.04419 ?0.33014


  4. Coefficients:

  5. Estimate Std. Error t value Pr(>|t|)

  6. (Intercept) ? ? ? ? 7.9471 ? ? 0.1101 ?72.188 6.35e-15 ***

  7. as.factor(ai)2001 ? 0.1604 ? ? 0.1109 ? 1.447 ?0.17849

  8. as.factor(ai)2002 ? 0.2718 ? ? 0.1208 ? 2.250 ?0.04819 *

  9. as.factor(ai)2003 ? 0.5904 ? ? 0.1342 ? 4.399 ?0.00134 **

  10. as.factor(ai)2004 ? 0.5535 ? ? 0.1562 ? 3.543 ?0.00533 **

  11. as.factor(ai)2005 ? 0.6126 ? ? 0.2070 ? 2.959 ?0.01431 *

  12. as.factor(bj)1 ? ? -0.9674 ? ? 0.1109 ?-8.726 5.46e-06 ***

  13. as.factor(bj)2 ? ? -4.2329 ? ? 0.1208 -35.038 8.50e-12 ***

  14. as.factor(bj)3 ? ? -5.0571 ? ? 0.1342 -37.684 4.13e-12 ***

  15. as.factor(bj)4 ? ? -5.9031 ? ? 0.1562 -37.783 4.02e-12 ***

  16. as.factor(bj)5 ? ? -4.9026 ? ? 0.2070 -23.685 4.08e-10 ***

  17. ---

  18. Signif. codes: ?0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


  19. Residual standard error: 0.1753 on 10 degrees of freedom

  20. (15 observations deleted due to missingness)

  21. Multiple R-squared: 0.9975, Adjusted R-squared: 0.9949

  22. F-statistic: 391.7 on 10 and 10 DF, ?p-value: 1.338e-11



  23. [,1] ? [,2] [,3] [,4] [,5] [,6]

  24. [1,] 2871.2 1091.3 41.7 18.3 ?7.8 21.3

  25. [2,] 3370.8 1281.2 48.9 21.5 ?9.2 25.0

  26. [3,] 3768.0 1432.1 54.7 24.0 10.3 28.0

  27. [4,] 5181.5 1969.4 75.2 33.0 14.2 38.5

  28. [5,] 4994.1 1898.1 72.5 31.8 13.6 37.1

  29. [6,] 5297.8 2013.6 76.9 33.7 14.5 39.3


  30. > sum(base$py[is.na(base$y)])

  31. [1] 2481.857

我們獲得與通過Chain Ladder方法獲得的結(jié)果略有不同。如Hachemeister和Stanard在1975年所建議的,我們還可以嘗試Poisson回歸(具有對數(shù)鏈接),




  1. Deviance Residuals:

  2. Min ? ? ? 1Q ? Median ? ? ? 3Q ? ? ?Max

  3. -2.3426 ?-0.4996 ? 0.0000 ? 0.2770 ? 3.9355


  4. Coefficients:

  5. Estimate Std. Error z value Pr(>|z|)

  6. (Intercept) ? ? ? ?8.05697 ? ?0.01551 519.426 ?< 2e-16 ***

  7. as.factor(ai)2001 ?0.06440 ? ?0.02090 ? 3.081 ?0.00206 **

  8. as.factor(ai)2002 ?0.20242 ? ?0.02025 ? 9.995 ?< 2e-16 ***

  9. as.factor(ai)2003 ?0.31175 ? ?0.01980 ?15.744 ?< 2e-16 ***

  10. as.factor(ai)2004 ?0.44407 ? ?0.01933 ?22.971 ?< 2e-16 ***

  11. as.factor(ai)2005 ?0.50271 ? ?0.02079 ?24.179 ?< 2e-16 ***

  12. as.factor(bj)1 ? ?-0.96513 ? ?0.01359 -70.994 ?< 2e-16 ***

  13. as.factor(bj)2 ? ?-4.14853 ? ?0.06613 -62.729 ?< 2e-16 ***

  14. as.factor(bj)3 ? ?-5.10499 ? ?0.12632 -40.413 ?< 2e-16 ***

  15. as.factor(bj)4 ? ?-5.94962 ? ?0.24279 -24.505 ?< 2e-16 ***

  16. as.factor(bj)5 ? ?-5.01244 ? ?0.21877 -22.912 ?< 2e-16 ***

  17. ---

  18. Signif. codes: ?0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


  19. (Dispersion parameter for poisson family taken to be 1)


  20. Null deviance: 46695.269 ?on 20 ?degrees of freedom

  21. Residual deviance: ? ?30.214 ?on 10 ?degrees of freedom

  22. (15 observations deleted due to missingness)

  23. AIC: 209.52


  24. Number of Fisher Scoring iterations: 4



  25. > round(matrix(base$py2,n,n),1)

  26. [,1] ? [,2] [,3] [,4] [,5] [,6]

  27. [1,] 3155.7 1202.1 49.8 19.1 ?8.2 21.0

  28. [2,] 3365.6 1282.1 53.1 20.4 ?8.8 22.4

  29. [3,] 3863.7 1471.8 61.0 23.4 10.1 25.7

  30. [4,] 4310.1 1641.9 68.0 26.1 11.2 28.7

  31. [5,] 4919.9 1874.1 77.7 29.8 12.8 32.7

  32. [6,] 5217.0 1987.3 82.4 31.6 13.6 34.7

  33. >

  34. > sum(base$py2[is.na(base$y)])

  35. [1] 2426.985

該預(yù)測與通過鏈梯方法獲得的估計量一致。Klaus Schmidt和AngelaWünsche于1998年在鏈梯,邊際總和和最大似然估計中建立了帶有最小偏差方法的鏈接。

?


R語言中回歸模型預(yù)測的不同類型置信區(qū)間應(yīng)用比較分析的評論 (共 條)

分享到微博請遵守國家法律
库尔勒市| 丽江市| 桓台县| 乌什县| 蕲春县| 奎屯市| 秭归县| 濮阳市| 改则县| 阿瓦提县| 澄迈县| 临汾市| 文化| 双桥区| 锦屏县| 镇平县| 曲阳县| 瑞金市| 工布江达县| 林州市| 宣汉县| 常宁市| 友谊县| 济阳县| 泊头市| 瑞丽市| 台南市| 海安县| 景宁| 孝感市| 武安市| 四川省| 基隆市| 高雄县| 吉木萨尔县| 辛集市| 弥勒县| 宁化县| 蛟河市| 砀山县| 皮山县|