真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

ALLPATHS-LG怎么安裝使用

這篇文章主要講解了“ALLPATHS-LG怎么安裝使用”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“ALLPATHS-LG怎么安裝使用”吧!

我們提供的服務(wù)有:網(wǎng)站建設(shè)、成都網(wǎng)站建設(shè)、微信公眾號(hào)開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、蓬溪ssl等。為近1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的蓬溪網(wǎng)站制作公司

ALLPATHS-LG 是由Broad Institiute研究所發(fā)明的一款基因組組裝軟件,不論是細(xì)菌/真菌等小型基因組,還是動(dòng)植物等大型基因組的組裝,它都能夠勝任。

和其他組裝軟件不同的是,allpaths-lg要求至少兩個(gè)文庫(kù)

  • 第一個(gè)文庫(kù)的插入片段長(zhǎng)度不能超過測(cè)序讀長(zhǎng)的兩倍,這樣可以保證雙端測(cè)序的reads之間存在overlap,這樣的文庫(kù)類型稱之為fragment

  • 第二個(gè)文庫(kù)的插入片段通常大于3kb,超長(zhǎng)讀長(zhǎng)有利于基因組的組裝,這樣的文庫(kù)類型稱之為jumping

除了插入片段外,allpaths-lg對(duì)測(cè)序深度也有要求,推薦100X以上。

在組裝時(shí),對(duì)于硬件資源也有一定的要求,對(duì)于哺乳動(dòng)物基因組,建議內(nèi)存大小為512G, 對(duì)于小基因組,建議內(nèi)存大小32G。

安裝過程如下

wget ftp://ftp.broadinstitute.org/pub/crd/ALLPATHS/Release-LG/latest_source_code/allpathslg-52488.tar.gz
tar xzvf allpathslg-52488.tar.gz
cd allpathslg-52488/
./configure --prefix=$(pwd)
make
make install

安裝好之后,在bin目錄下可以找到程序的可執(zhí)行文件。為了方便調(diào)用,可以把bin目錄添加到PATH環(huán)境變量中。官方提供了小的測(cè)試數(shù)據(jù)集, 可以幫助我們了解軟件的用法

wget ftp://ftp.broadinstitute.org/pub/crd/ALLPATHS/Release-LG/test.genome.tar.gz

allpaths-lg的運(yùn)行分成以下兩步

1. 準(zhǔn)備輸入文件

在bin目錄下,有一個(gè)名為PrepareAllPathsInputs.pl的可執(zhí)行文件,這個(gè)文件就是用來(lái)準(zhǔn)備輸入文件的。這個(gè)文件需要讀取以下兩個(gè)文件

in_groups.csv,示例如下

        file_name, library_name, group_name
seq/frags.?.fastq, Solexa-25396, frags
seq/jumps.?.fastq, Solexa-11542, jumps

逗號(hào)分隔的3列文件,group_name代表每組的唯一的ID,library_name代表文庫(kù)的名字, file_name 代表序列文件,對(duì)于雙端測(cè)序的文件,可以使用通配符來(lái)表示R1端和R2端。

in_libs.csv, 示例如下

library_name, project_name, organism_name, type, paired, frag_size, frag_stddev, insert_size, insert_stddev, read_orientation, genomic_start, genomic_end
Solexa-25396, test, test.genome, fragment, 1, 180, 10, , , inward, 0, 0
Solexa-11542, test, test.genome, jumping, 1, , , 3000, 500, outward, 0, 0

逗號(hào)分隔的12列文件,library_name和in_groups.csv文件中的文庫(kù)名字相同,project_name代表項(xiàng)目名稱,organism_name代表組裝的物種名稱,type代表文庫(kù)類型,fragment代表插入片段短,存在overlap的文庫(kù);jumping代表插入片段非常長(zhǎng)的文庫(kù),paired代表測(cè)序類型,0表示單端測(cè)序,1表示雙端測(cè)序;frag_size和frag_stddev只針對(duì)fragment文庫(kù),分別表示插入片段長(zhǎng)度的平均數(shù)和方差;insert_size和insert_stddev只針對(duì)jumping文庫(kù),分別代表jumping文庫(kù)插入片段長(zhǎng)度的均值和方差;read_orientation代表測(cè)序方向,genomic_start和genome_end用來(lái)過濾序列,小于genome_start和大于genome_end的序列會(huì)被過濾掉,在實(shí)際使用時(shí),直接填0就可以了。

對(duì)于fragment和jumping 文庫(kù),測(cè)序方向分別對(duì)應(yīng)inward和outward。

ALLPATHS-LG怎么安裝使用

以上兩個(gè)文件根據(jù)自己的數(shù)據(jù)填寫好之后,就可以運(yùn)行下面的代碼了

PrepareAllPathsInputs.pl \
DATA_DIR=$PWD/test.genome/data \
PLOIDY=1 \
IN_GROUPS_CSV=in_groups.csv \
IN_LIBS_CSV=in_libs.csv \
GENOME_SIZE=200000 \
OVERWRITE=True

DATA_DIR代表數(shù)據(jù)的存放目錄,要去必須是絕對(duì)路徑,test.genome必須和csv文件中的organism_name相同。PLOIDY代表染色體倍性,allpaths-lg目前只支持單倍體和二倍體。運(yùn)行結(jié)束后,在輸出目錄會(huì)生成如下文件

├── frag_reads_orig.fastb
├── frag_reads_orig.pairs
├── frag_reads_orig.qualb
├── frag_reads_orig.source.txt
├── jump_reads_orig.fastb
├── jump_reads_orig.pairs
├── jump_reads_orig.qualb
├── jump_reads_orig.source.txt
├── ploidy
└── read_cache

每個(gè)文庫(kù)的序列會(huì)生成對(duì)應(yīng)的.fastb, .pairs, qualb三個(gè)文件;ploidy 記錄染色體倍性;read_cache 是臨時(shí)目錄。

2. 組裝

準(zhǔn)備好輸入文件之后,就可以進(jìn)行組裝了,命令如下

RunAllPathsLG \
PRE=$PWD\
REFERENCE_NAME=test.genome\
DATA_SUBDIR=data\
RUN=run\
SUBDIR=test\
TARGETS=standard\
OVERWRITE=True

上述命令中的5個(gè)參數(shù)構(gòu)成了如下的目錄結(jié)構(gòu)

PRE/REFERENCE_NAME/DATA_SUBDIR/RUN/SUBDIR

allpaths-lg通過這樣的目錄結(jié)構(gòu)來(lái)存放多個(gè)基因組組裝的結(jié)果。

組裝的結(jié)果保存在SUBDIR 目錄下,final.contigs.fasta對(duì)應(yīng)contig的結(jié)果,final.assembly.fasta對(duì)應(yīng)scaffold的結(jié)果。

感謝各位的閱讀,以上就是“ALLPATHS-LG怎么安裝使用”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)ALLPATHS-LG怎么安裝使用這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!


網(wǎng)頁(yè)名稱:ALLPATHS-LG怎么安裝使用
標(biāo)題URL:http://weahome.cn/article/pjshoi.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部