今天就跟大家聊聊有關(guān)find_circ中如何識別環(huán)狀RNA,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
我們提供的服務有:網(wǎng)站制作、做網(wǎng)站、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認證、白銀ssl等。為上1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務,是有科學管理、有技術(shù)的白銀網(wǎng)站制作公司
官方的pipeline使用的是bowtie2軟件,代碼如下
bowtie2 -p16 \ --very-sensitive \ --score-min=C,-15,0 \ --mm \ -x hg19 -q \ -1 R1.fastq.gz -2 R2.fastq.gz \ 2> bowtie2.log \ | samtools view -hbuS - \ | samtools sort - accepted_hits
最終生成了一個排序之后的bam文件,其實這一步選擇其他的比對軟件,比如hisat也是可以的,只需要產(chǎn)生bam文件就可以了。
采用samtools軟件提取沒比對上的序列,代碼如下
samtools view -hf 4 accepted_hits.bam | samtools view -Sb - > unmapped.bam
代碼如下
unmapped2anchors.py unmapped.bam anchor.fq
bowtie2 -p 16 \ --reorder \ --mm \ --score-min=C,-15,0 \ -q -x human_bowtie2_index \ -U anchor.fq \ -S align.sam
代碼如下
cat align.sam | find_circ.py -G hg19.fa -p hsa_ > splice_sites.bed
結(jié)果如下所示
-p
參數(shù)指定的是第四列內(nèi)容的前綴,建議指定為物種對應的三字母縮寫,需要注意的是,在sites.bed
中同時包含了環(huán)狀RNA和線性RNA,環(huán)狀RNA的名稱用circ
標識,線性RNA的名稱用norm
標識。
根據(jù)以下規(guī)則對結(jié)果進行篩選
根據(jù)關(guān)鍵詞CIRCULAR篩選環(huán)狀RNA
去除線粒體上的環(huán)狀RNA
篩選unique junction reads數(shù)至少為2的環(huán)狀RNA
去除斷裂點不明確的環(huán)狀RNA
過濾掉長度大于100kb的circRNA,這里的100kb為基因組長度,直接用環(huán)狀RNA的頭尾相減即可
代碼如下
grep CIRCULAR splice_sites.bed | \ grep -v chrM | \ awk '$5>=2' | \ grep UNAMBIGUOUS_BP | \ grep ANCHOR_UNIQUE | \ ./maxlength.py 100000 \ > circ_candidates.bed
看完上述內(nèi)容,你們對find_circ中如何識別環(huán)狀RNA有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。