小編給大家分享一下motif中PFM矩陣是怎么樣的,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
目前創(chuàng)新互聯(lián)建站已為千余家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、網(wǎng)站托管、服務(wù)器租用、企業(yè)網(wǎng)站設(shè)計、津南網(wǎng)站維護等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
PFM全稱為position frequency matrix, 用于代表motif的堿基分布頻數(shù),本身是一個很容易了解的概念,以下圖所示的motif序列為例
根據(jù)以上8條序列可以統(tǒng)計出對應(yīng)的堿基分布頻數(shù),如下所示
每行為一種堿基,每一列為motif的一個位置。
在描述motif信息時,除了一致性序列和sequence logo外,PFM矩陣也是一個常見的元素。不同軟件會有不同的標準,理解這些格式就是本文的核心內(nèi)容。
JASPAR是一個常用的轉(zhuǎn)錄因子motif數(shù)據(jù)庫,在該數(shù)據(jù)庫中,針對PFM矩陣有多種格式,如下圖所示
原始的PFM矩陣示意如下
第一行和fasta格式的序列標識符類似,>
開頭,MA
開頭的字符串為轉(zhuǎn)錄因子在JASPAR數(shù)據(jù)庫中的編號,是唯一的,AGL3
表示該轉(zhuǎn)錄因子的名稱。
接下來的4行依次表示A
, C
, G
, T
4種堿基在每個位置的頻數(shù)分布。
JASPAR格式的PFM矩陣示意如下
和原始的PFM矩陣非常類似,只不過在每行的開頭標注了對應(yīng)的堿基,并且用[
和]
操作符將堿基頻數(shù)矩陣括起來。
TRANSFAC格式的PFM矩陣示意如下
采用了TRANSFAC數(shù)據(jù)庫中的文件標準,AC
表示motif編號,ID
表示motif的名稱,PO
以及下面的行為對應(yīng)的堿基分布頻數(shù)。
MEME格式的PFM矩陣示意如下
ALPJABEAT
代表堿基的字符集,strands
代表鏈的方向性,+ -
代筆在使用meme預(yù)測motif時沒有指定鏈的方向,Background
代表背景中的堿基組成頻率,MOTIF
和以下的行為對應(yīng)的堿基分布頻率。
不同的軟件和數(shù)據(jù)庫對應(yīng)的PFM矩陣的格式不同,在使用不同軟件和數(shù)據(jù)庫時需要注意。
看完了這篇文章,相信你對“motif中PFM矩陣是怎么樣的”有了一定的了解,如果想了解更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!