如何使用UCSC XENA綜合性分析某一個(gè)基因在癌癥當(dāng)中的作用,針對(duì)這個(gè)問題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問題的小伙伴找到更簡(jiǎn)單易行的方法。
創(chuàng)新互聯(lián)成立與2013年,先為李滄等服務(wù)建站,李滄等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為李滄企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
今天我們就基于UCSC XENA來簡(jiǎn)單的設(shè)計(jì)一個(gè)簡(jiǎn)單的課題。
之前在介紹ICGC數(shù)據(jù)庫使用的時(shí)候,我們可以通過ICGC數(shù)據(jù)庫來進(jìn)行整個(gè)基因組的檢索。比如來查看某個(gè)或者某幾個(gè)腫瘤當(dāng)中突變最多的基因是哪個(gè)。但是在UCSC XENA當(dāng)中我們需要有一定的檢索目標(biāo)。我們沒有辦法去尋找變化最大的基因。我們只能在提前知道某一個(gè)基因之后。然后才能進(jìn)行相關(guān)的查詢。但是UCSC XENA比ICGC好的地方在于。ICGC只能查詢突變相關(guān)的信息,而在XENA當(dāng)中,我們則可以檢索和這個(gè)基因所有相關(guān)的信息以及和臨床特征的相關(guān)性。
由于XENA只能檢索指定的基因來進(jìn)行檢索,所以我們?cè)跈z測(cè)的第一步需要選擇一個(gè)目標(biāo)基因。為了方便選擇,我們使用GEPIA2來尋找COAD當(dāng)中最有差異的前10的基因來進(jìn)行后續(xù)的分析
經(jīng)過這樣的篩選,我們一共獲得了五個(gè)在COAD當(dāng)中高表達(dá)的基因。這十個(gè)基因分別是:LCN15 ,NOTUM ,NPSR1,ASCL2 ,RNF43。
經(jīng)過這樣的篩選,我們知道了這幾個(gè)基因是和COAD的發(fā)生有關(guān)系的。但是對(duì)于COAD臨床參數(shù)的影響,我們不是很清楚。所以進(jìn)一步的我們想要看COAD當(dāng)中這十個(gè)基因的作用有多大
在XENA當(dāng)中。我們要做的第一步就是選擇目標(biāo)癌種,我們可以在數(shù)據(jù)集選擇的界面輸入關(guān)鍵詞就可以獲得相關(guān)的數(shù)據(jù)集了。
由于我們要對(duì)基因表達(dá)進(jìn)行分析。所以第一步就是放置基因相關(guān)的表達(dá)信息。在XENA里面,對(duì)于多基因的表達(dá)信息提取,有兩種方式:
一種是直接把所有基因都放進(jìn)去,這樣的話就可以在一個(gè)模塊當(dāng)中獲得所有目標(biāo)基因的表達(dá)信息,
另外一種的話就是一個(gè)基因一個(gè)基因的選擇。
前面一種除了可視化好一些,在后面和臨床參數(shù)分析方面,也可以一次性現(xiàn)實(shí)所有的結(jié)果,而后面一種則是可以來進(jìn)行預(yù)后的KM分析。
我們?cè)谧錾欧治龅臅r(shí)候,除了差異表達(dá)分析,做的第二多的可能就是預(yù)后分析了。在XENA 當(dāng)中,我們對(duì)于每一個(gè)單數(shù)據(jù)的模塊,都可以進(jìn)行預(yù)后分析。如果是連續(xù)性的,XENA會(huì)自動(dòng)分成兩組來進(jìn)行KM分析,如果是分類變量那么就可以直接進(jìn)行分析了。
PS:上面我們也說了。對(duì)于預(yù)后分析的時(shí)候,基因的表達(dá)是要單純一個(gè)模塊的。所以對(duì)于融合到一起的結(jié)果。我們是不能進(jìn)行分析的
通過以上的分析,我們就可以獲得五個(gè)基因的預(yù)后分析的結(jié)果了。經(jīng)過分析,我們發(fā)現(xiàn)這五個(gè)基因和預(yù)后都沒有關(guān)系????。
如果XENA只是可以做和預(yù)后相關(guān)的分析的話,那么其實(shí)很多數(shù)據(jù)庫都是可以做的(GEPIA, Cbio等等)。XENA更好的一點(diǎn)在于,它提供了TCGA里面所有相關(guān)的臨床病理參數(shù)的結(jié)果。我們可以做其他數(shù)據(jù)庫做不了的臨床參數(shù)的分析。比如:TNM分期這種的。
經(jīng)過一頓的數(shù)據(jù)添加,我們最終就得到了在COAD當(dāng)中含有基因表達(dá)以及TNM分期數(shù)據(jù)的數(shù)據(jù)集。
在得到最終想要分析的數(shù)據(jù)之后,我們發(fā)現(xiàn)由于XENA提供的沒有經(jīng)過修改的數(shù)據(jù),所以類似臨床數(shù)據(jù)是需要經(jīng)過處理的。例如M分期當(dāng)中:就包含:M0, M1, M1a, M1b以及Mx這個(gè)不確定分期的數(shù)據(jù)變量。
這個(gè)時(shí)候,最直接的方法,就是我們點(diǎn)擊Download然后下載到所有的原始數(shù)據(jù)之后,然后自己來處理數(shù)據(jù),然后進(jìn)行統(tǒng)計(jì)分析。
如果說,那我自己對(duì)于數(shù)據(jù)的處理和分析不是很熟練,那這個(gè)時(shí)候就可以利用XENA自帶的篩選功能來進(jìn)行分析了。
這里我們利用M分期為例來進(jìn)行演示XENA的篩選分析。由于操作過程教程。所以就簡(jiǎn)單的做了一個(gè)視頻。關(guān)于XENA具體的篩選原則可以參考: https://ucsc-xena.gitbook.io/project/overview-of-features/filter-and-subgrouping
最終通過分析,我們得到了NOTUM在M分期當(dāng)中存在差異表達(dá)。
關(guān)于如何使用UCSC XENA綜合性分析某一個(gè)基因在癌癥當(dāng)中的作用問題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識(shí)。