這篇文章將為大家詳細(xì)講解有關(guān)ANNOVAR是一款什么軟件,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)是一家專注于做網(wǎng)站、網(wǎng)站建設(shè)與策劃設(shè)計(jì),西安網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)做網(wǎng)站,專注于網(wǎng)站建設(shè)10余年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:西安等地區(qū)。西安做網(wǎng)站價(jià)格咨詢:13518219792
ANNOVAR 是一款變異位點(diǎn)注釋軟件,提供了多方位的注釋功能,支持多個(gè)物種,是最受歡迎的注釋軟件之一。
支持的物種包括以下6種:
huamn
mouse
worm
fly
yeast
others
ANNOVAR 對(duì)于學(xué)術(shù)和非盈利機(jī)構(gòu)而言是免費(fèi)下載的,只需要注冊(cè)個(gè)賬號(hào)就可以了。下載之后,解壓縮即可。解壓縮之后的文件列表如下
├── annotate_variation.pl ├── coding_change.pl ├── convert2annovar.pl ├── example ├── humandb ├── retrieve_seq_from_fasta.pl ├── table_annovar.pl └── variants_reduction.pl
ANNOVAR
是用perl語(yǔ)言編寫的,由一系列的perl腳本構(gòu)成。其中annotate_variation.pl
是最核心的腳本。
安裝好之后,第一步就是下載相關(guān)的數(shù)據(jù)庫(kù),命令如下
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar refGene humandb/
-downdb
表明該命令的用途是下載數(shù)據(jù)庫(kù),-buildver
指定基因組版本,默認(rèn)為hg18
, -webform
指定下載的鏈接,默認(rèn)是ucsc
, refGene
代表的是下載的數(shù)據(jù)庫(kù)的名字,humandb
表示數(shù)據(jù)庫(kù)存儲(chǔ)的路徑。
對(duì)于指定版本的參考基因組而言,可以通過(guò)如下命令查看其所有的數(shù)據(jù)庫(kù)
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar avdblist hg19_list/
用法和第一個(gè)示例相同,只不過(guò)數(shù)據(jù)庫(kù)的名字指定為avdblist
, 下載成功后會(huì)有
一個(gè)對(duì)應(yīng)的avdblist.txt
,部分內(nèi)容如下
hg19_abraom.txt.gz 20180312 23198051 hg19_abraom.txt.idx.gz 20180312 9837067 hg19_AFR.sites.2012_04.txt.gz 20140106 277370590 hg19_AFR.sites.2012_04.txt.idx.gz 20140106 22362560 hg19_ALL.sites.2010_11.txt.gz 20140106 179456415 hg19_ALL.sites.2010_11.txt.idx.gz 20140106 21944132 hg19_ALL.sites.2011_05.txt.gz 20140106 232127231
每一行代表一個(gè)數(shù)據(jù)庫(kù)文件。
參考基因組相關(guān)數(shù)據(jù)庫(kù)準(zhǔn)備好之后,就可以進(jìn)行注釋了。
第一步就是準(zhǔn)備輸入文件,輸入文件有兩種格式
ANNOVAR
自定義的格式,用空格或者制表符分隔,最少需要5列,分別代表染色體,起始位置,終止位置,參考基因組的堿基,變異之后的堿基,其他的列作為額外補(bǔ)充信息,示例如下
1 948921 948921 T C comments: rs15842, a SNP in 5' UTR of ISG15 1 13211293 13211294 TC - comments: rs59770105, a 2-bp deletion 1 11403596 11403596 - AT comments: rs35561142, a 2-bp insertion
VCF格式在之前的文章中介紹過(guò)了,這里不再贅述。VCF是突變分析的一種標(biāo)準(zhǔn)格式,大多數(shù)軟件都支持這種格式的輸出。
ANNOVAR
可以識(shí)別的格式就這兩種,當(dāng)你有其他格式的snp calling結(jié)果時(shí),可以使用convert2annovar.pl
進(jìn)行格式轉(zhuǎn)換。比如將VCF和pileup
格式的文件轉(zhuǎn)換為annovar
的輸入格式
convert2annovar.pl -format pileup variant.pileup -outfile variant.query convert2annovar.pl -format vcf4 variantfile -outfile variant.avinput
ANNOVAR
軟件的功能可以分成以下4大類
分析變異位點(diǎn)對(duì)蛋白質(zhì)的影響,支持多種基因集,包括RefSeq, UCSC, ENSEMBL, GENCODE 等。
分析變異位點(diǎn)是否位于基因組上的特殊區(qū)域,比如轉(zhuǎn)錄因子結(jié)合區(qū)域,組蛋白修飾區(qū)等。
分析變異位點(diǎn)是否位于指定的數(shù)據(jù)庫(kù)中,比如dbSNP, 1000G,ESP 6500等數(shù)據(jù)庫(kù),計(jì)算SIFT
,PolyPhen
, LRT
, MutationTaster
, MutationAssessor
, FATHMM
, MetaSVM
, MetaLR
等指標(biāo)。
從基因組上根據(jù)坐標(biāo)提取序列等小功能。
在實(shí)際分析中,主要使用annovar
的注釋功能??梢钥吹?,annovar
提供了3大類型的注釋。
關(guān)于“ANNOVAR是一款什么軟件”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。