本篇文章為大家展示了methylKit是進(jìn)行差異甲基化分析,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
創(chuàng)新互聯(lián)建站致力于互聯(lián)網(wǎng)品牌建設(shè)與網(wǎng)絡(luò)營銷,包括成都網(wǎng)站設(shè)計、網(wǎng)站建設(shè)、SEO優(yōu)化、網(wǎng)絡(luò)推廣、整站優(yōu)化營銷策劃推廣、電子商務(wù)、移動互聯(lián)網(wǎng)營銷等。創(chuàng)新互聯(lián)建站為不同類型的客戶提供良好的互聯(lián)網(wǎng)應(yīng)用定制及解決方案,創(chuàng)新互聯(lián)建站核心團(tuán)隊10多年專注互聯(lián)網(wǎng)開發(fā),積累了豐富的網(wǎng)站經(jīng)驗,為廣大企業(yè)客戶提供一站式企業(yè)網(wǎng)站建設(shè)服務(wù),在網(wǎng)站建設(shè)行業(yè)內(nèi)樹立了良好口碑。
methylKit 是一個用于分析甲基化測序數(shù)據(jù)的R包,不僅支持WGBS
,RRBS
和目的區(qū)域甲基化測序,還支持oxBS-sq
, TAB-seq
等分析5hmc
的數(shù)據(jù)。 其核心功能是差異甲基化分析和差異甲基化位點和區(qū)域的注釋。
安裝過程如下:
source(“http://bioconductor.org/biocLite.R“)
biocLite(“methylKit”)
推薦使用最新版本的R進(jìn)行安裝,這樣可以使用最新版本的methylKist
。
利用methylKit
做差異分析包括3步
每個樣本一個原始數(shù)據(jù),methylKit
支持兩種格式的methylation calling
文件
純文本格式
內(nèi)容如下
每一行是一個甲基化位點,coverage
代表覆蓋這個位點的reads數(shù),freqC
代表甲基化C的比例,freqT
代表非甲基化C的比例。這種純文本格式內(nèi)容非常直觀,文件大小相比bam 文件小很多,讀取的速度更快。
純文本格式的讀取過程如下
treatment
參數(shù)指定樣本的分組,0代表control
組,1代表treatment
組
bam文件
直接讀取Bismark
軟件比對產(chǎn)生的bam文件,通過processBismarkAln
實現(xiàn)
用法如下:
將所有樣本的甲基化情況合并,得到所有樣本的甲基化表達(dá)譜,用法如下
meth=unite(myobj, destrand=FALSE)
meth
中的內(nèi)容如下,其實就是之前的methylation calling
文件的合并
在合并的過程中,默認(rèn)情況下,只有所有的樣本都包含該位點時,才會保留,本質(zhì)就是取的所有樣本的交集,如果你想要取并集,可以修改min.per.group
參數(shù)的值,該參數(shù)的值代表每組中至少有多少個樣本覆蓋該位點時才保留,如果設(shè)置為1,就是取并集。
meth.min=unite(myobj,min.per.group=1L)
通過calculateDiffMeth
函數(shù)來執(zhí)行差異甲基化分析,用法如下
myDiff=calculateDiffMeth(meth)
根據(jù)甲基化C是變多了還是變少了,可以將差異甲基化的結(jié)果分為兩大類:
hypermethylated
hypomethylated
hypermethylated
表示相比control
組,treatment
組中的甲基化C更多;hypomethylated
則相反,表示treatment
組中的甲基化C比control
組中少。
采用getMethylDiff
函數(shù)提取差異分析的結(jié)果,用法如下
difference
函數(shù)表明差異的閾值,只有差異大于該閾值時,才會保留,起始就是meth.diff
的值,注意是絕對值大于difference
的值。
除了difference
閾值之外,還有qvalue
閾值,小于該閾值的結(jié)果保留。在methylKit
中,校正p值采用的是SILM
算法,和我們常規(guī)的BH
算法不同。type
參數(shù)定義差異的類型,如果你只關(guān)注hypermethylated
或者hypomethylated
,可以設(shè)置type 參數(shù)的值,單獨篩選。
在methylKit
中,它的差異分析總是針對合并后的甲基化表達(dá)譜,如果你的甲基化表達(dá)譜每一行是一個甲基化位點,那么差異分析的結(jié)果就是差異甲基化位點;如果你的表達(dá)譜每一行是一個甲基化區(qū)域,那么差異分析的結(jié)果就是差異甲基化區(qū)域。上面的例子都是針對差異甲基化位點的,下面看下差異甲基化區(qū)域的分析。
首先遇到的問題就是甲基化區(qū)域如何界定,在methylKit
中,按照滑動窗口的方式定義甲基化區(qū)域,默認(rèn)窗口大小為10000
bp ,步長為10000bp,通過tileMethylCounts
函數(shù)實現(xiàn)。
完整的差異甲基化區(qū)域分析的代碼如下:
上述內(nèi)容就是methylKit是進(jìn)行差異甲基化分析,你們學(xué)到知識或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識儲備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。