這篇文章將為大家詳細講解有關(guān)Cochran-Mantel-Haenszel檢驗在關(guān)聯(lián)分析中的應(yīng)用是怎樣的,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。
成都創(chuàng)新互聯(lián)專業(yè)為企業(yè)提供贊皇網(wǎng)站建設(shè)、贊皇做網(wǎng)站、贊皇網(wǎng)站設(shè)計、贊皇網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計與制作、贊皇企業(yè)網(wǎng)站模板建站服務(wù),10年贊皇做網(wǎng)站經(jīng)驗,不只是建網(wǎng)站,更提供有價值的思路和整體網(wǎng)絡(luò)服務(wù)。
Cochran-Mantel-Haenszel, 簡稱CMH檢驗,是分析兩個二分類變量之間關(guān)聯(lián)性的一種檢驗方法,在2 x 2 表格數(shù)據(jù)的基礎(chǔ)上,引入了第三個分類變量,稱之為混雜變量。混雜變量的引入使得該檢驗可以用于分析分層樣本,作為生物統(tǒng)計學(xué)領(lǐng)域的一種常用技術(shù),該檢驗常用于疾病對照研究。
下面來看一個最基本的例子,研究不同性別和候選人投票結(jié)果之間的關(guān)聯(lián),得到如下所示的2 x 2的表格
這里有兩個二分類變量,第一個是投票者的性別,第二個是候選人A和B??紤]到所有的投票者本身存在分層現(xiàn)象,來自3個不同的州,針對不同的州重新統(tǒng)計,得到如下的結(jié)果
上述例子中,投票者出現(xiàn)了分層現(xiàn)象,來自3個不同的州。如果不考慮這個因素,直接統(tǒng)計性別和候選人的頻數(shù)分布,采用卡方或者費舍爾精確檢驗來進行分析,即使得到了陽性的結(jié)果,也無法確定是不同性別之間真實存在投票的差異還是由于來自不同的州導(dǎo)致了這樣的差異。
由于投票者的分層現(xiàn)象,直接采用卡方或者費舍爾精確檢驗進行分析是不太合適的。在上述模型中,投票者的分層就是一個典型的混雜變量,對于這樣的數(shù)據(jù)可以采用CMH檢驗進行分析。
CMH檢驗針對每個分層統(tǒng)計2X2的表格,計算每一層的odd ratio值,然后在進行加權(quán),計算公共的odd ratio, 每一層用i
表示,統(tǒng)計的2X2表格數(shù)據(jù)如下
common odd raio的計算公式如下
從公式可以看出,利用每層的樣本總數(shù)進行了加權(quán),用于CMH分析的數(shù)據(jù)要求樣本量比較大,以保證每層的頻數(shù)表格中不會出現(xiàn)0的情況。該檢驗的統(tǒng)計量公式如下
服從自由度為1的卡方分布,上述數(shù)據(jù)在R中進行CMH檢驗的代碼如下
pvalue值大于0.05. 說明性別和候選者之間沒有關(guān)聯(lián)。如果直接對總體結(jié)果進行卡方或者費舍爾精確檢驗的話,得到的結(jié)論相反,計算過程如下
從這個數(shù)據(jù)可以看出,對于分層樣本,有必要進行CMH檢驗。需要說明的是,CMH檢驗假設(shè)所有分層的odd raio值相同,可以通過Breslow-Day test來進行檢驗,代碼如下
pvalue值大于0.05,說明不滿足odd ratio齊性。當(dāng)然對于分層數(shù)據(jù),除了CMH檢驗外,邏輯回歸也是一個很好的解決方法,而且更加通用,可以將混雜變量當(dāng)做回歸分析中的協(xié)變量來進行處理。
關(guān)于Cochran-Mantel-Haenszel檢驗在關(guān)聯(lián)分析中的應(yīng)用是怎樣的就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。