一文教你做卡方擬合優(yōu)度檢驗
一、什么時候用?
有這樣一種場景,總共收集100份數(shù)據(jù),其中男性為48個,女性為52個;在收集數(shù)據(jù)之前預(yù)期男女比例應(yīng)該是4:6 (40%為男性,60%為女性),那么預(yù)期的比例是否與實際的比例有著明顯的差異性呢?類似這類希望研究數(shù)據(jù)的實際比例與預(yù)期比例是否一致。則可以使用卡方擬合優(yōu)度檢驗。
二、卡方擬合優(yōu)度檢驗原理
卡方擬合優(yōu)度檢驗是一種非參數(shù)檢驗方法,其用于研究實際比例情況,是否與預(yù)期比例表現(xiàn)一致,它只針對于類別數(shù)據(jù)。
卡方擬合優(yōu)度檢驗的原理在于通過計算實際頻數(shù)與預(yù)期頻數(shù)的差值,且對差值進行平方,最終加和得到卡方值;然后通過卡方值計算得到p?值;如果說實際頻數(shù)與預(yù)期頻數(shù)差值特別大,則卡方值特別大,對應(yīng)的p?值也會特別小;因此檢驗出來就會顯示有明顯的差異性;反之如果基本沒有差異,那么實際頻數(shù)和預(yù)期頻數(shù)之間差值很小,則卡方值很小,計算得到的p?值會很大,最終顯示沒有差異性。
以下通過一個案例數(shù)據(jù)說明使用SPSSAU-數(shù)據(jù)分析工具如何快速完成卡方擬合優(yōu)度檢驗。
三、SPSSAU進行卡方擬合優(yōu)度檢驗
1、案例背景
當前共收集100份數(shù)據(jù),其中男性為48個,女性為52個。在收集數(shù)據(jù)之間已經(jīng)預(yù)計好男性比例為4:6,當前希望用卡方擬合優(yōu)度進行檢驗,以判定收集數(shù)據(jù)的分布是否與預(yù)期保持一致。收集數(shù)據(jù)最終匯總?cè)缦卤恚?/p>

特別提示
卡方擬合優(yōu)度檢驗共適用兩種數(shù)據(jù)格式,分別是‘加權(quán)格式’和‘不加權(quán)格式’;
上表為‘加權(quán)格式’,即單獨用一列表示各項的數(shù)量,稱為‘加權(quán)權(quán)重’,如果僅用一列表示數(shù)據(jù),即100個數(shù)據(jù)即為100行,則為‘不加權(quán)格式’,也即原始數(shù)據(jù)格式。
加權(quán)數(shù)據(jù)和原始數(shù)據(jù)格式的說明:SPSSAU:什么是加權(quán)格式數(shù)據(jù),什么是不加權(quán)格式數(shù)據(jù)(原始數(shù)據(jù))?
2、操作
本例子使用‘加權(quán)數(shù)據(jù)’格式,并且希望的男女比例分別是4:6,操作截圖如下:


關(guān)于期望比例設(shè)置上,可以設(shè)置成4和6;也可以寫成0.4和0.6,也或者寫成40和60均可;總之可以表達出相對比例均可,SPSSAU會自動進行‘歸一化’計算。
3、SPSSAU輸出結(jié)果
SPSSAU共輸出表格和圖形,具體如下:

4、智能文字分析

所以,男女的實際頻數(shù)分別是48和52,但預(yù)期分別是40和60;經(jīng)過卡方擬合優(yōu)度檢驗顯示,實際比例和期望比例并沒有呈現(xiàn)出顯著性差異(χ2=2.667,p?=0.102>0.05),意味著實際情況與期望情況基本一致,無明顯的差異性。而且可以結(jié)合圖形進行觀察,也顯示實際情況與期望情況區(qū)別很小,無統(tǒng)計學上的差異性。
5、圖表可視化


注意:
如果不設(shè)置預(yù)期比例,SPSSAU默認以各類別數(shù)據(jù)預(yù)期比例一致進行分析。