今天就跟大家聊聊有關(guān)如何理解CGA中的分析結(jié)果,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
成都創(chuàng)新互聯(lián)服務(wù)項目包括涪陵網(wǎng)站建設(shè)、涪陵網(wǎng)站制作、涪陵網(wǎng)頁制作以及涪陵網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,涪陵網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到涪陵省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
TCGA對于不同類型的數(shù)據(jù),有著獨特的處理流程,具體如下
TCGA中的DNA測序主要用來分析腫瘤患者中的體細胞突變,和GATK的體細胞突變流程類似,前期都經(jīng)過了一個預(yù)處理步驟,這里稱之為co-cleanning
, 流程示意如下
就是經(jīng)典的sort->markduplicate->Realign->BQSR步驟,得到co-cleaned BAM文件。然后用配對的腫瘤和正常樣本進行somatic variant calling, 得到VCF文件。然后進行體細胞突變的注釋,得到突變注釋文件MAF, 示意如下
在進行體細胞突變位點分析時,使用了以下4款不同的軟件同時分析
MuSE
Mutect2
SomaticSniper
Varscan2
各自對應(yīng)的pipeline示意如下
各自pipeline得到的VCF文件,使用VEP軟件對體細胞突變位點進行注釋,使用了以下數(shù)據(jù)庫進行注釋
GENCODE v.22
sift v.5.2.2
ESP v.20141103
polyphen v.2.2.2
dbSNP v.146
Ensembl genebuild v.2014-07
Ensembl regbuild v.13.0
HGMD public v.20154
ClinVar v.201601
注釋完成之后,會對突變位點進行過濾,去除低質(zhì)量的突變位點和潛在的生殖細胞突變位點,剩余的位點作為最終的體細胞突變位點,保存在MAF文件中供下載。
當然對于沒有配對的正常樣本,也有tumor-only variant calling workflow來處理,具體請參考以下鏈接
https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/DNA_Seq_Variant_Calling_Pipeline
mRNA分析是通過STAR的2-pass模式比對hg38參考基因組,然后使用HTSeq進行定量,定量時基于Gencode V22版本的GTF文件,流程示意如下
在定量時,提供了以下3種策略
Raw count
FPKM
FPKM-UQ
Raw count和FPKM是轉(zhuǎn)錄組分析中經(jīng)典的定量策略,而FPKM-UQ則是在FPKM基礎(chǔ)上新提出的一種策略,計算公式如下
和FPKM不同的是,在FPKM-UQ中采用所有基因Mapping reads數(shù)目的上四分位數(shù)代替了所有基因Mapping Reads的總數(shù)。官方也提供了一個示例幫助我們理解具體的計算過程
miRNA的分析采用了BCGSC開發(fā)的miRNA定量流程,這套流程只針對已知的miRNA進行定量,鏈接如下
https://github.com/bcgsc/mirna
流程示意如下
使用Affymetrix SNP 6.0芯片來分析CNV, 首先使用DNACopy
這個R包來計算拷貝數(shù),然后用GISTIC2
根據(jù)CNV來評估基因的變化情況,是loss
還是gain
, 流程示意如下
通過illumina Infinum Human Methylation 27和HumanMethylation450 兩個芯片平臺來分析DNA甲基化,采用了beta
值的定量策略。同時考慮到這兩個探針是針對hg19來設(shè)計的,將探針序列與hg38進行比對,當MAPQ<10或者I型和II型探針比對到不同基因組區(qū)域時,過濾到這部分探針。剩余的CpG文件根據(jù)GENCODE V22版本的GTF來進行注釋,根據(jù)這樣的策略將hg19上的甲基化移植到hg38版本的基因組上,具體流程示意如下
了解TCGA數(shù)據(jù)分析的流程,可以更好的在GDC數(shù)據(jù)庫中篩選數(shù)據(jù),也可以更好的和自己的數(shù)據(jù)進行比較。
看完上述內(nèi)容,你們對如何理解CGA中的分析結(jié)果有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。