真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

XHMM分析原理是怎樣的

今天就跟大家聊聊有關(guān)XHMM分析原理是怎樣的,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到永修網(wǎng)站設(shè)計(jì)與永修網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都做網(wǎng)站、網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、域名注冊(cè)、雅安服務(wù)器托管、企業(yè)郵箱。業(yè)務(wù)覆蓋永修地區(qū)。

XHMM是一款利用WES數(shù)據(jù)分析CNV的軟件,利用PCA降維來(lái)歸一化外顯子區(qū)的測(cè)序深度信息,然后通過(guò)隱馬可夫模型來(lái)預(yù)測(cè)CNV,該軟件的pipeline示意如下

XHMM分析原理是怎樣的

可以分成4個(gè)大的步驟

1. 比對(duì)參考基因組

將測(cè)序的reads比對(duì)到參考基因組上,計(jì)算外顯子區(qū)的原始測(cè)序深度。CNV預(yù)測(cè)的核心是通過(guò)測(cè)序深度和cnv的相關(guān)性來(lái)建模,所以需要保證這里的測(cè)序深度和真實(shí)DNA拷貝數(shù)的一致性,需要去除PCR重復(fù)。

官方推薦使用GATK最佳實(shí)踐中的預(yù)處理流程,  同時(shí)還可以添加一個(gè)MAPQ的過(guò)濾,篩選MAPQ大于20的alignemnts,得到可以用于下游分析的bam文件。

2. 歸一化測(cè)序深度

計(jì)算每個(gè)樣本各個(gè)外顯子的平均測(cè)序深度,得到一個(gè)exon平均測(cè)序深度的矩陣,示意如下

XHMM分析原理是怎樣的

每一行為一個(gè)樣本,每一列為一個(gè)eoxn區(qū)域,對(duì)應(yīng)的值為該exon區(qū)域在樣本內(nèi)的平均測(cè)序深度。

在歸一化之前,可以先對(duì)這個(gè)矩陣進(jìn)行一個(gè)預(yù)處理,即對(duì)樣本或者目標(biāo)區(qū)域進(jìn)行過(guò)濾。對(duì)于目標(biāo)區(qū)域,去除GC含量小于0.1或者大于0.9的目標(biāo)區(qū)域,去除包含10%以上的低復(fù)雜度序列的目標(biāo)區(qū)域,也可以根據(jù)測(cè)序深度進(jìn)行過(guò)濾,去除過(guò)低或者過(guò)高的目標(biāo)區(qū)域,比如去除測(cè)序深度小于5X的目標(biāo)區(qū)域;對(duì)于樣本,可以根據(jù)測(cè)序深度的分布進(jìn)行分析,去除離群的樣本。

預(yù)處理的目的是盡量保證用于后續(xù)分析的樣本在測(cè)序深度分布上的均一性,減小樣本間的偏差。預(yù)處理之后就可以進(jìn)行歸一化,考慮到GC含量帶來(lái)的PCR偏倚,芯片捕獲,mapping準(zhǔn)確率等系統(tǒng)誤差的影響,采用PCA算法來(lái)去除系統(tǒng)噪聲,得到歸一化之后的測(cè)序深度。

效果如下圖所示

XHMM分析原理是怎樣的

左側(cè)為原始的測(cè)序深度,右側(cè)為歸一化之后的測(cè)序深度,每條線代表一個(gè)樣本的測(cè)序深度值,灰色區(qū)域表示正常的二倍體,綠色區(qū)域表示拷貝數(shù)增加,歸一化之后二者區(qū)分的更加顯著。

3. 構(gòu)建隱馬可夫模型

將CNV在全基因組范圍內(nèi)分布的比例,長(zhǎng)度,exon之間的距離等因素都考慮進(jìn)來(lái),構(gòu)建了隱馬可夫模型, 將染色體區(qū)域分為以下3種類型

  1. diploid

  2. deletion

  3. duplication

第一種代表拷貝數(shù)正常,為2拷貝,對(duì)應(yīng)的測(cè)序深度為平均值,即baseline, 第二種代表缺失,小于2拷貝,測(cè)序深度低于平均值,第三種代表重復(fù),大于2拷貝,測(cè)序深度高于平均值。

隱馬可夫模型中3種狀態(tài)之間的轉(zhuǎn)移概率矩陣如下所示

XHMM分析原理是怎樣的

XHMM分析原理是怎樣的

4.  CNV calling

模型訓(xùn)練好之后,對(duì)于每個(gè)樣本,通過(guò)維特比算法來(lái)分析染色體區(qū)域的拷貝數(shù)狀態(tài),從而檢測(cè)CNV。

看完上述內(nèi)容,你們對(duì)XHMM分析原理是怎樣的有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。


文章名稱:XHMM分析原理是怎樣的
轉(zhuǎn)載注明:http://weahome.cn/article/ipiogi.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部