怎樣使用Clustal進(jìn)行多序列比對,相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。
創(chuàng)新互聯(lián)公司是一家集成都做網(wǎng)站、成都網(wǎng)站制作、成都外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站頁面設(shè)計(jì)、網(wǎng)站優(yōu)化SEO優(yōu)化為一體的專業(yè)網(wǎng)站設(shè)計(jì)公司,已為成都等多地近百家企業(yè)提供網(wǎng)站建設(shè)服務(wù)。追求良好的瀏覽體驗(yàn),以探求精品塑造與理念升華,設(shè)計(jì)最適合用戶的網(wǎng)站頁面。 合作只是第一步,服務(wù)才是根本,我們始終堅(jiān)持講誠信,負(fù)責(zé)任的原則,為您進(jìn)行細(xì)心、貼心、認(rèn)真的服務(wù),與眾多客戶在蓬勃發(fā)展的市場環(huán)境中,互促共生。
多序列比對在保守區(qū)域鑒定,系統(tǒng)發(fā)育分析,motif識別等多個領(lǐng)域發(fā)揮重要作用,是生物信息數(shù)據(jù)分析必備的基礎(chǔ)技能之一。Clustal是一款經(jīng)典的多序列比對工具,支持DNA, RNA, 蛋白質(zhì)的比對。
clustal 有兩個版本可用,之前的版本同時提供了GUI和命令行兩種工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。
最新本的omega比對準(zhǔn)確度更高,而且速度更快,適合幾千條規(guī)模的多序列比對,該軟件目前只提供了命令行版本。在官網(wǎng)上,提供了源代碼和編譯好的二進(jìn)制文件
通常情況下,直接下載對應(yīng)的二進(jìn)制可執(zhí)行文件就行了。軟件的基本用法如下:
clustalo -i seq.fasta > align.fa
-i
指定輸入的序列文件,默認(rèn)輸出結(jié)果打印在屏幕上,可以重定向到指定文件中。該軟件支持多種格式的輸出
fasta
clustal
msf
phylip
selex
stockholm
vienna
默認(rèn)輸出格式為fasta
, 可以通過--outfmt
參數(shù)指定輸出文件的格式。多序列比對不同于Blast的地方在于,Blast是局部比對,而多序列比對是全局比對。全局比對意味著需要將輸入序列對齊到同一個水平來比對,一般是通過在輸入序列中插入堿基的方式來使序列對齊,示意如下
>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT GACCTCCAAATACCGTTAA >ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT GACCTCCAAGTACCGTTAA >ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT CTCTGAGAAGTACCGCTAA
通過在序列中插入-
來使得序列對齊。如果不習(xí)慣命令行的操作方式,也有在線服務(wù)可以使用。EBI提供的在線服務(wù)網(wǎng)址如下
https://www.ebi.ac.uk/Tools/msa/clustalo/
使用非常簡單,輸入序列,調(diào)整參數(shù)設(shè)置,然后提交即可。在輸出結(jié)果中,還提供了顏色標(biāo)記,進(jìn)化樹可視化等功能。
通過Mview
可視化多序列比對結(jié)果,示意如下
也支持導(dǎo)出到Jalview
軟件中進(jìn)行可視化。
通過Phylogenetic Tree
可以查看進(jìn)化樹的結(jié)果,默認(rèn)采用NJ法建樹,示意如下
也可以通過Send to Simple Phylogeny, 創(chuàng)建進(jìn)化樹,支持NJ和UPGMA兩種建樹方式。
看完上述內(nèi)容,你們掌握怎樣使用Clustal進(jìn)行多序列比對的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!