最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

已知均值和標準誤,做bootstrap統(tǒng)計分析【錯題本】

2023-09-06 13:08 作者:米糊炒面吶吶吶  | 我要投稿

bootstrap分析的目的,應該是假定我們當前獲得的數(shù)據(jù)存在隨機取樣的誤差,推測真實值所在的位置后比較真實值和指定值是否有差異——因為我們不知道真實值,所以只能從手頭數(shù)據(jù)得到真實值的概率分布、然后通過比較真實值的概率分布與指定值的包含關系,確定真實值在多大概率上與指定值有差異。 已知n個人兩個條件的平均數(shù)據(jù)x_bar_i和**標準誤差sem_i** (i = 1, 2 為條件編號),想通過bootstrap方法判斷顯著性差異,即針對每個條件、在均值加減標準差的**隨機分布**里(這里假定隨機數(shù)據(jù)服從高斯分布),有放回隨機取樣數(shù)次(比如10000),每次都計算兩個條件的差值,最后得到兩個條件差值的分布,如果分布的95%置信區(qū)間(也就是從分布中尋找累積概率在2.5%-97.5%的數(shù)據(jù)范圍)包含零,則兩個條件沒有差異,如果不包含零,則在p = 5%的犯錯概率上有顯著差異。 遇到了一個問題:這個**隨機分布**的標準差,應該取sem_i還是n個人得到的標準差sd_i = sem_i*(n)^2呢? 錯誤答案:我一開始想,我們感興趣的是真實值,真實值的分布寬度(標準差SD_i)可以用樣本的分布寬度(sd_i)來估計,所以在做bootstrap隨機取樣的時候,應該使用樣本的分布寬度來替代真實值的分布寬度,所以應該選取sd_i。 然而,這個答案錯誤的地方是:手頭已有n個人的平均數(shù)據(jù)x_bar時,真實值服從的分布不是N(x_bar,sd_i^2),而是N(x_bar, sem_i^2)。 解釋: 這里有SEM(standard error of the mean)的數(shù)學推導, en.wikipedia.org/wiki/Standard_error#:~:text=for%20further%20discussion.-,Derivation,and%20some%20simple%20properties%20thereof.

推導結論:從某個正態(tài)分布N (mu, sigma^2)取樣n個點的話,這n個點的均值x_bar的分布是N (mu, sigma^2/n); SEM是均值x_bar的分布的標準差(standard deviation),也就是sigma/sqrt(n) 所以已知n個人的數(shù)據(jù)均值為x,SEM為sem的話,x則視為從均值分布中取出的一個點;從x推斷均值分布的中心位置應該服從分布N(x, sem^2);所以在做bootstrap的時候,要從N(x, sem_i^2)里頭取樣。 對應我自己的筆記微博:https://weibo.com/5896214783/Ni1x72nPC

已知均值和標準誤,做bootstrap統(tǒng)計分析【錯題本】的評論 (共 條)

分享到微博請遵守國家法律
揭西县| 黄陵县| 太谷县| 崇左市| 西宁市| 那坡县| 双城市| 鲁山县| 开化县| 衡水市| 大理市| 来凤县| 邢台县| 广河县| 永善县| 钦州市| 怀远县| 辽宁省| 九江市| 湖州市| 大兴区| 加查县| 紫金县| 莱州市| 武强县| 昭苏县| 垫江县| 铜山县| 达尔| 梓潼县| 丰顺县| 瑞安市| 磐石市| 阿克苏市| 托克逊县| 涟水县| 武安市| 固始县| 双桥区| 阿瓦提县| 荔浦县|