本篇文章為大家展示了fusioncatcher中怎么實現(xiàn)融合基因操作,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
中江網(wǎng)站建設公司成都創(chuàng)新互聯(lián),中江網(wǎng)站設計制作,有大型網(wǎng)站制作公司豐富經(jīng)驗。已為中江上千提供企業(yè)網(wǎng)站建設服務。企業(yè)網(wǎng)站搭建\外貿(mào)營銷網(wǎng)站建設要多少錢,請找那個售后服務好的中江做網(wǎng)站的公司定做!
fusioncatcher也提供了準備參考基因組的腳本,該腳本會從Ensembl等網(wǎng)站自動下載數(shù)據(jù),所以使用時需要聯(lián)網(wǎng),用法如下
fusioncatcher-build -g mus_musculus -o /db/mouse -w asia.ensembl.org
-g
參數(shù)指定參考基因組的物種名稱,-o
指定輸出結(jié)果的目錄,-w
參數(shù)指定ensembl web service, 即biomart的的網(wǎng)址。需要注意的是,-w
參數(shù)一定要設置成上述示例中的樣子,默認參數(shù)是不可以的,另外對于人和小鼠而言,因為會從gencode數(shù)據(jù)庫下載文件,而gencode的FTP地址發(fā)生了變動,所以要手動修改源代碼中g(shù)encode的FTP地址。
對于-o
參數(shù)的取值,可以參考如下鏈接
ftp://ftp.ensembl.org/pub/current_fasta
該目錄下每個物種對應一個文件夾,fusioncatcher就是根據(jù)-o
參數(shù)的取值來下載對應物種的序列。
除了下載文件,該步驟還包括建立索引等費時較長的步驟,所以這一步的運行時間會比較久,需要5-10個小時。
對于human
而言,官方提供基于Ensembl release 90版本建立的數(shù)據(jù)庫,下載方式如下
mkdir -p /some/human/data/ cd /some/human/data/ wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.aa wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ab wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ac wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ad cat human_v90.tar.gz.* | tar xz ln -s human_v90 current
用法如下
fusioncatcher \ -d database_directory \ -i fastq_directory \ -o output_directory
-d
參數(shù)指定物種的參考基因組所在目錄,-i
參數(shù)指定樣本對應的原始測序數(shù)據(jù)fastq
文件所在目錄,-o
參數(shù)指定輸出結(jié)果的目錄。
對于原始序列所在的目錄,在該目錄下可以同時存在多個樣本的結(jié)果,軟件會自動識別不同樣本對應的R1和R2端數(shù)據(jù)。
由于fusioncatcher內(nèi)置了質(zhì)量控制的程序,會自動對fastq
文件進行去除adapter,去除低質(zhì)量等分析,所以我們只需要提供原始的測序數(shù)據(jù)就可以了。
在輸出目錄中,final-list_candidate-fusion-genes.txt 就是最終預測到的所有融合基因,這個目錄下文件很多,每個文件的詳細解釋可以參考官方文檔。
上述內(nèi)容就是fusioncatcher中怎么實現(xiàn)融合基因操作,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。