真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

如何使用MISO進(jìn)行可變剪切的分析

如何使用MISO進(jìn)行可變剪切的分析,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

創(chuàng)新互聯(lián)建站專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于成都做網(wǎng)站、成都網(wǎng)站建設(shè)、成都外貿(mào)網(wǎng)站建設(shè)、元寶山網(wǎng)絡(luò)推廣、小程序設(shè)計(jì)、元寶山網(wǎng)絡(luò)營(yíng)銷、元寶山企業(yè)策劃、元寶山品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營(yíng)等,從售前售中售后,我們都將竭誠(chéng)為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);創(chuàng)新互聯(lián)建站為所有大學(xué)生創(chuàng)業(yè)者提供元寶山建站搭建服務(wù),24小時(shí)服務(wù)熱線:18982081108,官方網(wǎng)址:www.cdcxhl.com

MISO是一款經(jīng)典的可變剪切分析工具,和rmats類似,該軟件也支持對(duì)可變剪切事件進(jìn)行定量和差異分析。

這個(gè)軟件支持exon和transcript兩種水平的可變剪切分析,在rmats的文章中,我們也提到了rmats是從exon水平給出的可變剪切結(jié)果,因?yàn)槎鷾y(cè)序讀長(zhǎng)短的特點(diǎn),無法有效得到轉(zhuǎn)錄本全長(zhǎng),從exon水平得到的結(jié)果更加的準(zhǔn)確,而且陽性結(jié)果更容易通過RT-PCR驗(yàn)證出來,但是無法詳細(xì)的探究某個(gè)基因不同isoform之間的變化;transcript水平直接給出不同isoform間的定量和差異,能有效的探究基因不同isofrm的變化情況,但是結(jié)果準(zhǔn)確性較差。

該軟件是一個(gè)python包,直接通過pip就可以安裝,分析的pipeline如下

如何使用MISO進(jìn)行可變剪切的分析

1. 對(duì)參考基因組的GFF文件建索引

對(duì)于transcript水平的分析而言,只需要提供轉(zhuǎn)錄本的GFF文件,可以從Ensembl等數(shù)據(jù)庫(kù)下載參考基因組的gtf文件,然后自己轉(zhuǎn)換成GFF3格式;對(duì)于exon水平而言,需要提供已知的可變剪切事件的GFF格式文件,示意如下

chr1  SE      gene    4772649 4775821 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-;Name=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-
chr1  SE      mRNA    4772649 4775821 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-
chr1  SE      mRNA    4772649 4775821 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.B;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-
chr1  SE      exon    4775654 4775821 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A.up;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A
chr1  SE      exon    4774032 4774186 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A.se;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A
chr1  SE      exon    4772649 4772814 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A.dn;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.A
chr1  SE      exon    4775654 4775821 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.B.up;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.B
chr1  SE      exon    4772649 4772814 .       -       .       ID=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.B.dn;Parent=chr1:4775654:4775821:-@chr1:4774032:4774186:-@chr1:4772649:4772814:-.B

第二列表示可變剪切的類型,以外顯子跳躍為例,ID的格式如下

chr1:4775654:4775821:-@chr1:4774032:4774186:@chr1:4772649:4772814

包含了用@符號(hào)隔開的3個(gè)外顯子,中間的exon的跳過的外顯子,第一個(gè)為上游的外顯子,第二個(gè)為下游的外顯子,對(duì)應(yīng)如下示意圖中的3個(gè)exon

如何使用MISO進(jìn)行可變剪切的分析

transcript水平的GFF文件從數(shù)據(jù)庫(kù)中下載即可,而exon水平的GFF文件是需要自己先識(shí)別可變剪切的不同isoform,然后整理得到的,對(duì)于人和小鼠等常見物種,官網(wǎng)提供了exon水平的GFF文件,鏈接如下

https://miso.readthedocs.io/en/fastmiso/annotation.html

準(zhǔn)備好GFF文件之后,就可以建立索引了,命令如下

index_gff --index ensGene.gff3 index_db

index_db為索引保存的目錄。

2. 運(yùn)行miso

運(yùn)行miso需要第一步建好的索引以及樣本對(duì)應(yīng)的bam文件,該bam文件必須是經(jīng)過排序處理的,而且有對(duì)應(yīng)的bai索引,對(duì)于雙端數(shù)據(jù),用法如下

miso --run
index_db \
algin.sorted.bam \  
--output-dir out_dir \
--read-len 150 \
--paired-end 250 15 \
--settings-filename miso_settings.txt

read-len是reads的平均長(zhǎng)度,paired-end代表插入片段長(zhǎng)度的平均值和方差,miso_settings.txt是配置文件,內(nèi)容如下

[data]
filter_results = True
min_event_reads = 20
strand = fr-unstranded
[sampler]
burn_in = 500
lag = 10
num_iters = 5000
num_processors = 4

配置文件中的參數(shù)很多,就不一一解釋了,每個(gè)參數(shù)的意義請(qǐng)參考官方文檔。
通過上述方式得到的結(jié)果可以直接用于后續(xù)的差異分析,但是這個(gè)結(jié)果不利于我們查看,所以官方提供了匯總程序,用法如下

summarize_miso \
--summarize-samples \
raw_out/ \
summary_out1
3. 樣本間的差異分析

進(jìn)行樣本間差異分析的代碼如下

compare_miso --compare-samples control case/ comparisons/

在輸出目錄,會(huì)生成一個(gè)后綴為bf的文件。

4. 對(duì)結(jié)果進(jìn)行過濾

用法如下

filter_events \
--filter  case_vs_control.miso_bf \
--num-inc 1 \
--num-exc 1 \
--num-sum-inc-exc 10 \
--delta-psi 0.20 \
--bayes-factor 10 \
--output-dir filter_dir
5. 可視化

用法如下

sashimi_plot \
--plot-event "chr1:7778:7924:-@chr1:7096:7605:-@chr1:6717:6918:-" \
index_db/ \
sashimi_plot_settings.txt  \
--output-dir out_dir

sashimi_plot_settings.txt是配置文件,其中設(shè)置了樣本的bam文件和可變剪切的輸出結(jié)果,示例如下

[data]
# directory where BAM files are
bam_prefix = ./test-data/bam-data/
# directory where MISO output is
miso_prefix = ./test-data/miso-data/

bam_files = [
    "heartWT1.sorted.bam",
    "heartWT2.sorted.bam",
    "heartKOa.sorted.bam",
    "heartKOb.sorted.bam"]

miso_files = [
    "heartWT1",
    "heartWT2",
    "heartKOa",
    "heartKOb"]

[plotting]
# Dimensions of figure to be plotted (in inches)
fig_width = 7
fig_height = 5
# Factor to scale down introns and exons by
intron_scale = 30
exon_scale = 4
# Whether to use a log scale or not when plotting
logged = False
font_size = 6

# Max y-axis
ymax = 150

# Whether to plot posterior distributions inferred by MISO
show_posteriors = True

# Whether to show posterior distributions as bar summaries
bar_posteriors = False

# Whether to plot the number of reads in each junction
number_junctions = True

resolution = .5
posterior_bins = 40
gene_posterior_ratio = 5

# List of colors for read denisites of each sample
colors = [
    "#CC0011",
    "#CC0011",
    "#FF8800",
    "#FF8800"]

# Number of mapped reads in each sample
# (Used to normalize the read density for RPKM calculation)
coverages = [
    6830944,
    14039751,
    4449737,
    6720151]

# Bar color for Bayes factor distribution
# plots (--plot-bf-dist)
# Paint them blue
bar_color = "b"

# Bayes factors thresholds to use for --plot-bf-dist
bf_thresholds = [0, 1, 2, 5, 10, 20]

最終會(huì)產(chǎn)生如下所示的結(jié)果

如何使用MISO進(jìn)行可變剪切的分析

這種圖稱之為sashimi plot , 是一種專用于可變剪切可視化的圖表,上述示意圖表示的是一個(gè)外顯子跳躍事件在不同樣本中的表達(dá)情況,左下方是GFF文件中共的exon結(jié)構(gòu),左上方是每個(gè)樣本中比對(duì)上exon的reads的可視化,采用了RPKM表示,不同剪切方式用曲線鏈接,曲線上標(biāo)記的是比對(duì)上該區(qū)域的reads數(shù)目,不同分組的樣本用不同顏色表示,右側(cè)的圖片是樣本中對(duì)應(yīng)的可變剪切的表達(dá)量值。

從這種圖中,可以直觀的看到兩組樣本間的可變剪切表達(dá)有無差異,上圖中heartWT組中的表達(dá)量高于heartKO組。

實(shí)際分析時(shí),由于需要手動(dòng)整理可變剪切isofrom對(duì)應(yīng)的gff文件,所以使用的難度較大,但是其提供的可視化功能是非常值得借鑒的。

看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對(duì)創(chuàng)新互聯(lián)的支持。


新聞名稱:如何使用MISO進(jìn)行可變剪切的分析
文章源于:http://weahome.cn/article/jspjgo.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部