這篇文章給大家介紹seq2HLA如何利用RNA_seq數(shù)據(jù)進(jìn)行HLA分型,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比永定網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式永定網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋永定地區(qū)。費用合理售后完善,10年實體公司更值得信賴。
對于不同的HLA Allel來說,exon2和exon3 序列的差異性尤為明顯,很多的HLA 分型軟件都會根據(jù)這部分序列,整理出HLA Allel序列參考數(shù)據(jù)庫。
seq2HLA也采用了類似的策略,通過HLA不同Allel的exon2和exon3的序列,整理了一份HLA參考數(shù)據(jù)庫,通過將RNA_seq的reads與該數(shù)據(jù)庫比對,確定HLA分型結(jié)果,原理示意圖如下
迭代兩次,每次挑選出覆蓋度最高的Allel 作為分型結(jié)果。
seq2HLA采用python和R進(jìn)行開發(fā),安裝過程較為簡單,直接下載源代碼即可,安裝過程如下
git clone https://github.com/TRON-Bioinformatics/seq2HLA cd seq2HLA/
用法如下:
python seq2HLA.py -1 R1.fastq -2 R2.fastq -r test -p 10
-1
和-2
參數(shù)分別指定輸入的R1和R2端的fastq格式的序列; -r
參數(shù)指定輸出文件名稱的前綴,-p
指定線程數(shù),主要是bowtie比對時的線程。
輸出文件非常多,詳細(xì)列表如下
test.ambiguity test-ClassI-class.bowtielog test-ClassI-class.expression test-ClassI-class.HLAgenotype2digits test-ClassI-class.HLAgenotype4digits test-ClassII.bowtielog test-ClassII.expression test-ClassII.HLAgenotype2digits test-ClassII.HLAgenotype4digits test-ClassI-nonclass.bowtielog test-ClassI-nonclass.expression test-ClassI-nonclass.HLAgenotype2digits test-ClassI-nonclass.HLAgenotype4digits
我們主要關(guān)注后綴為HLAgenotype4digits
的結(jié)果文件,可以看到,同時體用了HLA Clas I 和 Class II 兩種類型基因的分型結(jié)果。以HLA I型基因的4位分型結(jié)果為例,文件內(nèi)容如下
#Locus Allele 1 Confidence Allele 2 Confidence A A*02:65 0.008687167 A*02:65 NA B B*39:05' 0.3821314 B*13:48 0.09848174 C C*08:02' NA C*08:02 NA
對于HlA I型基因,給出了A, B, C 三個基因的分型結(jié)果,每個基因給出了兩個Allel, 對于每個Allel, 會給出對應(yīng)的打分值。
關(guān)于seq2HLA如何利用RNA_seq數(shù)據(jù)進(jìn)行HLA分型就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。