真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

怎么使用EXCAVATOR2檢測WES的CNV

怎么使用EXCAVATOR2檢測WES的CNV,針對這個問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:申請域名、網(wǎng)絡(luò)空間、營銷軟件、網(wǎng)站建設(shè)、東風(fēng)網(wǎng)站維護(hù)、網(wǎng)站推廣。

excavator2是一款利用WES數(shù)據(jù)進(jìn)行CNV分析的軟件,其他同類軟件通常只關(guān)注捕獲的exon區(qū)域,而該軟件則進(jìn)行了延伸,將捕獲區(qū)域劃分為exon和非exon區(qū)域兩部分,在校正測序深度的分布時對這兩部分區(qū)域分別分別進(jìn)行處理,對應(yīng)的文章發(fā)表在Nucleic Acids Research上,鏈接如下

https://academic.oup.com/nar/article/44/20/e154/2607979

該軟件的源代碼保存在sourceforge上,鏈接如下

https://sourceforge.net/projects/excavator2tool/

excavator2在計算測序深度時將reads分為了以下兩個部分

  1. in-target reads

  2. off-target reads

in-target表示的是位于exon上的序列,off-target表示的是位于基因間區(qū)或者內(nèi)含子區(qū)的序列,同樣采用了滑動窗口的方式來統(tǒng)計每個區(qū)域的測序深度,只不過稍作變化,全稱如下

mean windows read count

簡稱WMRC, 計算公式如下

怎么使用EXCAVATOR2檢測WES的CNV

單個外顯子直接作為一個窗口,而非外顯子區(qū)域則采用了一個固定長度的窗口,分開統(tǒng)計不同區(qū)域的測序深度,并進(jìn)行校正,校正的時候考慮了GC含量,不同區(qū)域的mappability, 外顯子的大小等因素。

利用歸一化之后的測序深度,計算對照樣本和實驗樣本的log2 ratio值,然后采用HSLM segmentation算法劃分segment, 最后通過FastCall算法預(yù)測每個segment的拷貝數(shù)情況,細(xì)分為以下5種

  1. two-copy deletion

  2. one-copy deletion

  3. normal

  4. one-copy duplication

  5. multiple-copy duplicaiton

該軟件支持hg19和hg38兩個版本,內(nèi)置了對應(yīng)的數(shù)據(jù)庫,示意如下

怎么使用EXCAVATOR2檢測WES的CNV

該軟件分成了3個模塊,對應(yīng)3個腳本,具體操作步驟如下

1. TargetPerla.pl

提供一個捕獲區(qū)域的bed文件,計算in-target和off-target區(qū)域的GC含量,mappability值,用于后續(xù)的歸一化操作,用法如下

perl TargetPerla.pl \
SourceTarget.txt \
myTarget.bed \
MyTarget_w50000 \
50000 \
hg19

第一個參數(shù)為source target文件,該文件記錄了基因組對應(yīng)的bw文件和fasta文件的路徑,內(nèi)容示意如下

/data/ucsc.hg19.bw /data/hg19.fasta

空格分隔的兩列,第一列為bw文件的路徑,該文件是軟件自帶的,位于軟件的安裝目錄,用于計算基因組不同區(qū)域的mappability,第二列為fasta文件的路徑,用于計算不同區(qū)域的GC含量。

第二個參數(shù)為捕獲區(qū)域的bed文件,第三個參數(shù)為輸出結(jié)果的前綴,第四個參數(shù)為窗口的固定長度,第五個參數(shù)指定基因組的版本。

這一步類似于比對時建立參考基因組的索引,一個芯片建立一次即可,運(yùn)行成功后,會生成一個文件夾,前綴為MyTarget_w50000。

2. EXCAVATORDataPrepare.pl

計算測序深度,進(jìn)行歸一化處理,用法如下

perl EXCAVATORDataPrepare.pl \
ExperimentalFile.txt \
--processors 6 \
--target MyTarget_w50000 \
--assembly hg19

第一個參數(shù)是一個空格分隔的txt文件,指定了樣本對應(yīng)的bam文件,輸出結(jié)果的路徑,樣本名稱信息,內(nèi)容示意如下

怎么使用EXCAVATOR2檢測WES的CNV

--processors指定并行的線程數(shù),--target參數(shù)指定第一步生成的target的名稱,--assembly指定參考基因組的版本。

3. EXCAVATORDataAnalysis.pl

執(zhí)行HSLM segmentation算法和FastCall算法,進(jìn)行CNV分析,用法如下

perl EXCAVATORDataAnalysis.pl \
ExperimentalFileAnalysis.txt \
--processors 6  \
--target MyTarget_w50000 \
--assembly hg19 \
--output Results_MyProject_w50K \
--mode pooling

--mode參數(shù)表示樣本如何進(jìn)行比較,支持pooling和paired兩種模式,第一種模式將所有的實驗樣本混合與對照樣本進(jìn)行比較,第二種模式則是配對樣本模式,比如癌和癌旁,兩兩之間進(jìn)行比較,計算log2 ration值。

第一個參數(shù)ExperimentalFileAnalysis.txt是一個空格分隔的txt文件,指定了樣本的比較操作,對于pooling模式,其內(nèi)容示意如下

怎么使用EXCAVATOR2檢測WES的CNV

對于paired模式,其內(nèi)容示意如下

怎么使用EXCAVATOR2檢測WES的CNV

T表示Treat, C表示Control, 后面的數(shù)字用于區(qū)分不同樣本。

--output指定了輸出結(jié)果的目錄,輸出結(jié)果中提供了CNV區(qū)域?qū)?yīng)的txt, VCF等文件,同時還提供了可視化的結(jié)果,示意如下

怎么使用EXCAVATOR2檢測WES的CNV

關(guān)于怎么使用EXCAVATOR2檢測WES的CNV問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。


新聞標(biāo)題:怎么使用EXCAVATOR2檢測WES的CNV
轉(zhuǎn)載注明:http://weahome.cn/article/ppddes.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部