這篇文章主要講解了“如何使用seqLogo可視化motif”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“如何使用seqLogo可視化motif”吧!
目前創(chuàng)新互聯(lián)已為上1000家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)絡(luò)空間、成都網(wǎng)站托管、企業(yè)網(wǎng)站設(shè)計(jì)、克東網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長(zhǎng),共同發(fā)展。
seqLogo是一個(gè)bioconductor上的R包,專門用于DNA序列的motif可視化,網(wǎng)址如下
https://www.bioconductor.org/packages/release/bioc/html/seqLogo.html
因?yàn)楣δ艿膯我恍?,所以其用法也特別的簡(jiǎn)單,只需要輸入motif對(duì)應(yīng)的PPM矩陣就可以了,下面通過(guò)一個(gè)實(shí)際例子來(lái)看下
上圖為一個(gè)motif的PFM矩陣,只需要通過(guò)以下幾個(gè)步驟就可以得到對(duì)應(yīng)的sequence logo。
將PFM矩陣保存在一個(gè)文件pfm.txt
中,內(nèi)容如下
注意PFM矩陣中規(guī)定堿基順序?yàn)?code>ACGT, 不能任意調(diào)換堿基的順序。通過(guò)R語(yǔ)言來(lái)讀取,代碼如下
data <- read.table("pfm.txt", header = F, sep = "\t", row.names = 1)
PPM矩陣就是將PFM矩陣中的頻數(shù)轉(zhuǎn)化成頻率,除以每列的總和就可以了, 代碼如下
ppm <- sapply(1:ncol(data), function(t){ data[[t]] / sum(data[[t]]) })
ppm
的內(nèi)容如下
因?yàn)樾械捻樞蚪y(tǒng)一為ACGT
, 所以我們不需要設(shè)置行名稱。
基本用法如下
p <- makePWM(ppm)
seqLogo(p)
輸出結(jié)果示意如下
相比其他工具,這個(gè)R包的功能較為單一,存在無(wú)法調(diào)整配色方案等問(wèn)題,但是作為一個(gè)可視化工具,其足夠簡(jiǎn)單,已經(jīng)能滿足基本要求。
感謝各位的閱讀,以上就是“如何使用seqLogo可視化motif”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)如何使用seqLogo可視化motif這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!