真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

qtMAF過濾的方法

這篇文章主要講解了“qt MAF過濾的方法”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“qt MAF過濾的方法”吧!

創(chuàng)新互聯(lián)建站成立與2013年,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站建設(shè)網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元珠暉做網(wǎng)站,已為上家服務(wù),為珠暉各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:13518219792

經(jīng)過去掉缺失,去掉錯(cuò)誤的性別信息,得到的文件為:

HapMap_3_r3_6.bed  HapMap_3_r3_6.fam  HapMap_3_r3_6.log
HapMap_3_r3_6.bim  HapMap_3_r3_6.hh

這里,我們根據(jù)最小等位基因頻率(MAF)去篩選。

「為什么要根據(jù)MAF去篩選?」

?  

最小等位基因頻率怎么計(jì)算?比如一個(gè)位點(diǎn)有AA或者AT或者TT,那么就可以計(jì)算A的基因頻率和T的基因頻率,qA + qT = 1,這里誰比較小,誰就是最小等位基因頻率,比如qA = 0.3, qT = 0.7, 那么這個(gè)位點(diǎn)的MAF為0.3. 之所以用這個(gè)過濾標(biāo)準(zhǔn),是因?yàn)镸AF如果非常小,比如低于0.02,那么意味著大部分位點(diǎn)都是相同的基因型,這些位點(diǎn)貢獻(xiàn)的信息非常少,增加假陽性。更有甚者M(jìn)AF為0,那就是所有位點(diǎn)只有一種基因型,這些位點(diǎn)沒有貢獻(xiàn)信息,放在計(jì)算中增加計(jì)算量,沒有意義,所以要根據(jù)MAF進(jìn)行過濾。

?     

1. 去掉性染色體上的位點(diǎn)

「思路:」

  • 在map文件中選擇常染色體,提取snp信息
  • 根據(jù)snp信息進(jìn)行提取

「提取常染色體上的位點(diǎn)名稱:」

因?yàn)檫@里是人的數(shù)據(jù),所以染色體只需要去1~22的常染色體,提取它的家系ID和個(gè)體ID,后面用于提取。

awk '{ if($1 >=1 && $1 <= 22) print $2}' HapMap_3_r3_6.bim > snp_1_22.txt
 
wc -l snp_1_22.txt
1399306 snp_1_22.txt
 

常染色體上共有1399306位點(diǎn)。 

2. 提取常染色體上的位點(diǎn)

這里,用到了位點(diǎn)提取參數(shù)--extract

plink --bfile HapMap_3_r3_6 --extract snp_1_22.txt --make-bed --out HapMap_3_r3_7
 

「查看日志:」

PLINK v1.90b6.5 64-bit (13 Sep 2018)           www.cog-genomics.org/plink/1.9/
(C) 2005-2018 Shaun Purcell, Christopher Chang   GNU General Public License v3
Logging to HapMap_3_r3_7.log.
Options in effect:
 --bfile HapMap_3_r3_6
 --extract snp_1_22.txt
 --make-bed
 --out HapMap_3_r3_7

515185 MB RAM detected; reserving 257592 MB for main workspace.
1431211 variants loaded from .bim file.
163 people (79 males, 84 females) loaded from .fam.
112 phenotype values loaded from .fam.
--extract: 1399306 variants remaining.
Using 1 thread (no multithreaded calculations invoked).
Before main variant filters, 112 founders and 51 nonfounders present.
Calculating allele frequencies... done.
Total genotyping rate is 0.998153.
1399306 variants and 163 people pass filters and QC.
Among remaining phenotypes, 56 are cases and 56 are controls.  (51 phenotypes
are missing.)
--make-bed to HapMap_3_r3_7.bed + HapMap_3_r3_7.bim + HapMap_3_r3_7.fam ...
done.
 

可以看到,共有163個(gè)基因型,共有1399306個(gè)SNP 

3. 計(jì)算每個(gè)SNP位點(diǎn)的基因頻率

首先,通過參數(shù)--freq,計(jì)算每個(gè)SNP的MAF頻率,通過直方圖查看整體分布??梢暬瘯?huì)更加直接。

plink --bfile HapMap_3_r3_7 --freq --out MAF_check
 

結(jié)果文件:MAF_check.frq預(yù)覽:

qt MAF過濾的方法

4. 對(duì)基因頻率作圖

「R代碼:」

maf_freq <- read.table("MAF_check.frq", header =TRUE, as.is=T)
pdf("MAF_distribution.pdf")
hist(maf_freq[,5],main = "MAF distribution", xlab = "MAF")
dev.off()
 

「圖形如下:」qt MAF過濾的方法

可以看出,很多基因頻率為0,說明沒有分型,這些位點(diǎn)需要?jiǎng)h掉。

4. 去掉MAF小于0.05的位點(diǎn)

plink --bfile HapMap_3_r3_7 --maf 0.05 --make-bed --out HapMap_3_r3_8 

日志:

PLINK v1.90b6.5 64-bit (13 Sep 2018)           www.cog-genomics.org/plink/1.9/
(C) 2005-2018 Shaun Purcell, Christopher Chang   GNU General Public License v3
Logging to HapMap_3_r3_8.log.
Options in effect:
 --bfile HapMap_3_r3_7
 --maf 0.05
 --make-bed
 --out HapMap_3_r3_8

515185 MB RAM detected; reserving 257592 MB for main workspace.
1399306 variants loaded from .bim file.
163 people (79 males, 84 females) loaded from .fam.
112 phenotype values loaded from .fam.
Using 1 thread (no multithreaded calculations invoked).
Before main variant filters, 112 founders and 51 nonfounders present.
Calculating allele frequencies... done.
Total genotyping rate is 0.998153.
325518 variants removed due to minor allele threshold(s)
(--maf/--max-maf/--mac/--max-mac).
1073788 variants and 163 people pass filters and QC.
Among remaining phenotypes, 56 are cases and 56 are controls.  (51 phenotypes
are missing.)
--make-bed to HapMap_3_r3_8.bed + HapMap_3_r3_8.bim + HapMap_3_r3_8.fam ...
done.
 

可以看到,325518個(gè)位點(diǎn)被刪掉了,剩余1073788 個(gè)位點(diǎn)。

「結(jié)果文件:」

HapMap_3_r3_8.bed  HapMap_3_r3_8.bim  HapMap_3_r3_8.fam  HapMap_3_r3_8.log

感謝各位的閱讀,以上就是“qt MAF過濾的方法”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)qt MAF過濾的方法這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!


網(wǎng)頁題目:qtMAF過濾的方法
標(biāo)題鏈接:http://weahome.cn/article/pjjjsj.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部