本篇文章為大家展示了WGCNA如何從module中挖掘關(guān)鍵基因,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
創(chuàng)新互聯(lián)公司是一家專業(yè)提供上虞企業(yè)網(wǎng)站建設(shè),專注與成都網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè)、成都h5網(wǎng)站建設(shè)、小程序制作等業(yè)務(wù)。10年已為上虞眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站建設(shè)公司優(yōu)惠進(jìn)行中。
識(shí)別到與表型數(shù)據(jù)相關(guān)的modules之后,還可以在該modules中進(jìn)一步篩選基因,為了方便篩選,對(duì)于每個(gè)基因定義了以下三個(gè)統(tǒng)計(jì)量
連接度,在之前的文章中,簡(jiǎn)單提過這個(gè)概念,類似于網(wǎng)絡(luò)中節(jié)點(diǎn)的degree
的概念,只不過在加權(quán)共表達(dá)網(wǎng)絡(luò)中,由于每條邊代表兩個(gè)基因間的相關(guān)性的大小,對(duì)應(yīng)一個(gè)數(shù)值,所以一個(gè)基因在共表達(dá)網(wǎng)絡(luò)中的連接度定義為與該基因相連的所有邊的數(shù)值之和。
另外,根據(jù)相連的基因是否和該基因位于同一個(gè)module, 又可以將邊分為兩類,和該基因位于同一個(gè)module內(nèi),定義為within, 位于不同的modules, 定義為out。在WGCNA中,可以通過intramodularConnectivity
函數(shù)計(jì)算連接度,用法如下
# 計(jì)算基因間的鄰接值 ADJ1=abs(cor(datExpr,use="p"))^6 #計(jì)算連接度 Alldegrees1=intramodularConnectivity(ADJ1, colorh2)
計(jì)算的結(jié)果如下
> head(Alldegrees1) kTotal kWithin kOut kDiff Gene1 31.80186 28.37595 3.425906 24.95005 Gene2 28.88249 26.47896 2.403522 24.07544 Gene3 25.38600 23.11852 2.267486 20.85103
KTotal
代表該基因的所有邊的連接度,KWithin
代表和該基因位于同一個(gè)module下的邊的連接度,KOut
代表和該基因位于不同module下的邊的連接度,所以KTotal
是KWithin
和KOut
之和,KDiff
代表KWithin
和KOut
的差值。
在module中,會(huì)存在hub gene的概念,所謂的hub gene, 就是該module下連接度最大的基因,注意此時(shí)只考慮位于該module下的邊,就是上文的KWithin
。
簡(jiǎn)稱MM, 將該基因的表達(dá)量與module的第一主成分,即module eigengene進(jìn)行相關(guān)性分析就可以得到MM值,所以MM值本質(zhì)上是一個(gè)相關(guān)系數(shù),如果基因和某個(gè)module的MM值為0,說明二者根本不相關(guān),該基因不屬于這個(gè)module; 如果MM的絕對(duì)值接近1,說明基因與該module相關(guān)性很高。
在WGCNA中,計(jì)算基因與module之間的MM值的代碼如下
datKME = signedKME( datExpr, datME, outputColumnName="MM.")
第一個(gè)參數(shù)為基因表達(dá)量,第二個(gè)參數(shù)為Module Eigengene值,結(jié)果如下
> head(datKME) MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170 Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483 Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211 Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603 Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067 Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
簡(jiǎn)稱GS, 將該基因的表達(dá)量與對(duì)應(yīng)的表型數(shù)值進(jìn)行相關(guān)性分析,最終的相關(guān)系數(shù)的值就是GS, GS反映出基因表達(dá)量與表型數(shù)據(jù)的相關(guān)性,計(jì)算GS的代碼如下
GS1=as.numeric(cor(y,datExpr, use="p"))
通過以上三個(gè)量化指標(biāo),可以方便對(duì)module下的基因進(jìn)行篩選。通常情況下,通過module和表型數(shù)據(jù)的相關(guān)性分析,我們可以篩選得到和感興趣的某一表型相關(guān)的具體的modules,在該module下面深入挖掘基因時(shí),可以通過MM
和GS
兩個(gè)指標(biāo)作為過濾手段,示例如下
FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8
假設(shè)brown是我們找到的和表型高度相關(guān)的module, 其中的關(guān)鍵基因可以定義為和brown
這一表型的GS值大于0.2,而且MM值大于0.8的基因。篩選出關(guān)鍵基因后,可以通過功能富集分析進(jìn)一步挖掘其功能。
上述內(nèi)容就是WGCNA如何從module中挖掘關(guān)鍵基因,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。