本篇內容主要講解“bedtools怎么操作VCF文件”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“bedtools怎么操作VCF文件”吧!
創(chuàng)新互聯(lián)是一家朝氣蓬勃的網站建設公司。公司專注于為企業(yè)提供信息化建設解決方案。從事網站開發(fā),網站制作,網站設計,網站模板,微信公眾號開發(fā),軟件開發(fā),小程序制作,十多年建站對混凝土攪拌罐等多個方面,擁有多年的網站維護經驗。
一 mpileup 函數(shù)
使用方法:bcftools mpileup [OPTIONS] -f ref.fa in.bam [in2.bam […]]
示例:bcftools mpileup -C 50 -m 2 -F 0.002 -d 1000 -q 20 -Q 20 -a DP,DP4,ADR -f hg19.fa A.bam B.bam
參數(shù)說明:
-f: 指定參考基因組,后跟需要變異檢測的bam文件,bam較少時可以直接寫;
bcftools mpileup -f hg19.fa A.bam B.bam
-b:后跟一個bamlist的文件;
bcftools mpileup -f hg19.fa -b bamList
-C --adjust-MQ INT 矯正的MQ值,推薦是50;
-q, -min-MQ INT (MQ質量值)# 過濾MQ質量值;
-Q, --min-BQ INT (base質量值)# 過濾base質量值;
-r, --regions 只call特定的染色體,或者點,區(qū)域
形式為CHR|CHR:POS|CHR:FROM-TO|CHR:FROM-[,…];
示例:bcftools mpileup -r chr1 -f hg19.fa A.bam | bcftools call -c -v > A.chr1.vcfbcftools mpileup -r chr1:111111-122222 -f hg19.fa A.bam B.bam | bcftools call -c -v > A.chr1_111111-122222.vcf
-R, --regions-file FILE 當有多個region時,將region存入文件,使用-R參數(shù),文件格式:tab分割的三列,chr start end即可 ;
-a, --annotate LIST 在INFO/FORMAT列中增加一些如DP,DP4,AD等的信息,群call可能會需要;
Comma-separated list of FORMAT and INFO tags to output.
二 bcftools call函數(shù)
使用方法:bcftools call [OPTIONS] FILE
示例:bcftools mpileup -f hg19.fa A.bam B.bam | bcftools call -c -v -r chr1:111111-122222 -s A -V indels
示例說明:
只檢測A樣本,且只輸出chr1:111111-122222區(qū)域的SNP信息,保存到test2.vcf文件中。
參數(shù)說明:
-c -m為兩種call的方式,舊版本使用-c ,現(xiàn)在默認使用-m,能解決大部分任務
-V, --skip-variants snps|indels 跳過SNP或者INDEL位點
-v, --variants-only 只輸出變異位點
-s, --samples LIST 只檢測此處給出的樣本ID (通用參數(shù))
-S, --samples-file FILE 只對此文件中列出的樣本進行檢測 (通用參數(shù))
-r -R為通用參數(shù),與上面用法一致
三 bcftools filter 函數(shù)
使用方法:bcftools filter [OPTIONS] FILE
示例:bcftools filter ALL.vcf TYPE="snp" -e 'DP < 20 || MQ < 20 || %QUAL<10 || DP < 20 ||MAF < 0.05 || '
示例說明:群體檢測結果ALL.vcf文件中,只保留 質量值大于10,MQ大于20,MAF大于等于0.05,樣本總深度大于20X的過濾后的SNP數(shù)據集。
參數(shù)說明:
TYPE="snp":只保留SNP信息;
-s:樣本過濾,bcftools filter ALL.vcf -s A
-e 可加感興趣的各種參數(shù),常見的如下:
群體樣本總深度DP:bcftools filter ALL.vcf TYPE="snp" -e 'DP < 20'
前兩個樣本的DP:bcftools filter ALL.vcf -e 'FORMAT/DP[0-1] < 20 '
最小等位基因頻率:bcftools filter ALL.vcf -e 'MAF < 0.05 ' |ee
質量值和mapping 質量值:bcftools filter ALL.vcf -e ‘%QUAL<10 || MQ < 20 '
BAF值(alt depth / (ref depth + alt depth ))
熟練使用以上及鏈接中的參數(shù),就可以辦到不寫py或者pl腳本,強勢過濾了。
四 bcftools index 函數(shù)
bgzip 壓縮 vcf 文件為 gz 文件
bgzip -c A.vcf >A.vcf.gz ;bgzip -c B.vcf >B.vcf.gz
bcftools 為 gz 文件建索引
bcftools index -t A.vcf.gz ; bcftools index -t B.vcf.gz
五 bcftools merge 函數(shù)
使用說明:將多個VCF文件,合并成一個VCF文件
bcftools merge -m snps -f PASS,. --force-samples A.vcf.gz B.vcf.gz > A_B.merge.vcf
同樣不用自己寫腳本合并VCF文件,省事 且較少出錯。
到此,相信大家對“bedtools怎么操作VCF文件”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!