真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

怎么使用trim_galore對NGS數(shù)據(jù)進行質(zhì)量過濾

怎么使用trim_galore對NGS數(shù)據(jù)進行質(zhì)量過濾,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

創(chuàng)新互聯(lián)專注于浦口網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供浦口營銷型網(wǎng)站建設(shè),浦口網(wǎng)站制作、浦口網(wǎng)頁設(shè)計、浦口網(wǎng)站官網(wǎng)定制、微信小程序定制開發(fā)服務(wù),打造浦口網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供浦口網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

cutadapt軟件可以對NGS數(shù)據(jù)進行質(zhì)量過濾,F(xiàn)astQC軟件可以查看NGS數(shù)據(jù)的質(zhì)量分布,trim_galore將這兩個軟件封裝到一起,使用起來更加的方便。

該軟件會對數(shù)據(jù)進行以下4步處理

1. 去除reads 3’端的低質(zhì)量堿基

illumina平臺的測序數(shù)據(jù),通常3’端質(zhì)量較差。trim_galore首先會過濾掉3’端的低質(zhì)量堿基,本質(zhì)上是調(diào)用了cutadapt的質(zhì)量過濾算法。下圖是過濾前后堿基質(zhì)量的分布圖

怎么使用trim_galore對NGS數(shù)據(jù)進行質(zhì)量過濾

可以看到,過濾掉低質(zhì)量堿基后,序列的整體質(zhì)量顯著提高。

2. 去除adapter序列

過濾掉低質(zhì)量的堿基之后,trim_galore會調(diào)用cutadapt在reads的3’端查找adapter 序列并去除。通常情況下,我們需要指定對應(yīng)的adapter序列,如果沒有指定的化,trim_galore會自動查找以下3種類型的adapter

Illumina:   AGATCGGAAGAGC
Small RNA:  TGGAATTCTCGG
Nextera:    CTGTCTCTTATA

默認讀取前一百萬條序列,通過這一百萬條序列判斷adapter屬于上述三種的哪一種,然后進行去除。如果你不希望軟件自動判斷,也可以通過--illumina, --nextera, --small_rna參數(shù)指定對應(yīng)的adapter類型。

3. 去除長度太短的序列

經(jīng)過上述兩步處理之后,有可能剩余的序列長度很短,這部分短序列也會被去除。默認情況下,如果序列長度少于20bp, 這條序列會被丟掉。

4. 其它過濾

對于所有的輸入序列,以上3個步驟是肯定會執(zhí)行的。除此之,trim_galore還支持一些其他的過濾措施,以滿足個性化的需求。

hardtrim5參數(shù)用于從序列的3’端切除堿基,示意如下

before:         CCTAAGGAAACAAGTACACTCCACACATGCATA
--hardtrim5 20: CCTAAGGAAACAAGTACACT

通過hardtrim5參數(shù)可以將序列截取成固定長度。與之對應(yīng)的,還有一個hardtrim3參數(shù),從序列的5’端切除堿基,示意如下

before:         CAAATGTTATTTTTAAGAAAATGGAAAAT
--hardtrim3 20:          TTTTTAAGAAAATGGAAAAT

軟件的安裝也很方便,首先需要確保cutadaptfastqc這兩個軟件已經(jīng)安裝,并且可執(zhí)行文件位于PAH環(huán)境變量定義的路徑種。然后下載trim_galore的源代碼包,解壓即可,代碼如下

wget https://github.com/FelixKrueger/TrimGalore/archive/0.5.0.tar.gz
tar xzvf 0.5.0.tar.gz

在軟件的安裝目錄有一個名為trim_galore的可執(zhí)行文件。

對于單端測序數(shù)據(jù),基本用法如下

trim_galore  --quality 20 -a AGATCGGAAGAGC --length 20  -o out_dir  input.fq

對于雙端測序數(shù)據(jù),基本用法如下

trim_galore --paired --quality 20 -a AGATCGGAAGAGC   -a2 AGATCGGAAGAGC --length 20  -o out_dir  R1.fq.gz R2.fq.gz

看完上述內(nèi)容,你們掌握怎么使用trim_galore對NGS數(shù)據(jù)進行質(zhì)量過濾的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!


本文名稱:怎么使用trim_galore對NGS數(shù)據(jù)進行質(zhì)量過濾
標(biāo)題URL:http://weahome.cn/article/jpoidc.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部