這篇文章主要講解了“如何使用ggseqlogo可視化motif”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“如何使用ggseqlogo可視化motif”吧!
發(fā)展壯大離不開廣大客戶長期以來的信賴與支持,我們將始終秉承“誠信為本、服務(wù)至上”的服務(wù)理念,堅(jiān)持“二合一”的優(yōu)良服務(wù)模式,真誠服務(wù)每家企業(yè),認(rèn)真做好每個(gè)細(xì)節(jié),不斷完善自我,成就企業(yè),實(shí)現(xiàn)共贏。行業(yè)涉及人造霧等,在網(wǎng)站建設(shè)、成都營銷網(wǎng)站建設(shè)、WAP手機(jī)網(wǎng)站、VI設(shè)計(jì)、軟件開發(fā)等項(xiàng)目上具有豐富的設(shè)計(jì)經(jīng)驗(yàn)。
ggseqlogo是一個(gè)motif可視化的R包,可以看做是seqLogo的加強(qiáng)版。除了基本的創(chuàng)建sequence logo的功能,新增了許多自定義的選項(xiàng),靈活性更強(qiáng),項(xiàng)目網(wǎng)址如下
https://omarwagih.github.io/ggseqlogo/
接受兩種格式的motif信息,第一種為序列數(shù)據(jù),以下圖為例
在R中的表示方式如下
motif_seq <- c(
"CCCATTGTTCTC",
"TTTCTGGTTCTC",
"TCAATTGTTTAG",
"CTCATTGTTGTC",
"TCCATTGTTCTC",
"CCTATTGTTCTC",
"TCCATTGTTCGT",
"CCAATTGTTTTG"
)
第二種為motif的PFM矩陣,以下圖為例
在R中的表示方式如下
motif_pfm <- rbind(
c(0, 0, 2, 7, 0, 0, 0, 0, 0, 0, 1, 0),
c(4, 6, 4, 1, 0, 0, 0, 0, 0, 5, 0, 5),
c(0, 0, 0, 0, 0, 1, 8, 0, 0, 1, 1, 2),
c(4, 2, 2, 0, 8, 7, 0, 8, 8, 2, 6, 1)
)
rownames(motif_pfm) <- c("A", "C", "G", "T")
準(zhǔn)備好任意一種符合格式的輸入文件之后,就可以進(jìn)行可視化了。對于序列格式的信息,繪圖方式如下
ggseqlogo(motif_seq)
輸出結(jié)果如下
對于PFM矩陣,繪圖方式如下
ggseqlogo(motif_pfm)
輸出結(jié)果如下
以上只是ggseqlogo的基本用法,除此之外,還有以下幾種額外功能
和webLogo類似,針對核酸和蛋白序列,內(nèi)置了多種配色方案。對于DNA和RNA序列,支持以下兩種配色防范
nucleotide
base_pairing
對于蛋白質(zhì)序列,支持以下幾種配色方案
chemistry
hydrophobicity
clustalx
taylor
默認(rèn)情況下會(huì)自動(dòng)根據(jù)輸入的序列類型自動(dòng)匹配配色方案,可以通過col_scheme
強(qiáng)制指定,用法如下
ggseqlogo(motif_pfm, col_scheme='base_pairing')
輸出結(jié)果示意如下
還支持自定義配色方案,具體細(xì)節(jié)請參考官方文檔。
當(dāng)有多個(gè)motif信息時(shí),支持一鍵繪制多個(gè)motif的sequence logo, 用法如下
motif_list <- list(
"A"=motif_pfm,
"B"=motif_pfm,
"C"=motif_pfm,
"D"=motif_pfm)
ggseqlogo(motif_list,ncol = 2)
將多個(gè)motif信息存儲(chǔ)在list
中,直接操作這個(gè)list對象即可,輸出結(jié)果如下
除了這些功能外,還提供了自定義字符集,字符高度,字體等各種功能,更多用法與細(xì)節(jié)請參閱幫助文檔。
感謝各位的閱讀,以上就是“如何使用ggseqlogo可視化motif”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對如何使用ggseqlogo可視化motif這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識點(diǎn)的文章,歡迎關(guān)注!