這篇文章將為大家詳細(xì)講解有關(guān)eggNOG數(shù)據(jù)庫有什么用,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
成都網(wǎng)絡(luò)公司-成都網(wǎng)站建設(shè)公司成都創(chuàng)新互聯(lián)公司10余年經(jīng)驗成就非凡,專業(yè)從事成都網(wǎng)站設(shè)計、成都網(wǎng)站建設(shè),成都網(wǎng)頁設(shè)計,成都網(wǎng)頁制作,軟文發(fā)布平臺,廣告投放等。10余年來已成功提供全面的成都網(wǎng)站建設(shè)方案,打造行業(yè)特色的成都網(wǎng)站建設(shè)案例,建站熱線:18980820575,我們期待您的來電!
直系同源蛋白的預(yù)測在系統(tǒng)發(fā)育,比較基因組學(xué)等多個領(lǐng)域都占用重要地位,COG數(shù)據(jù)庫開創(chuàng)了同源蛋白數(shù)據(jù)庫的先河,后續(xù)又不斷有新的數(shù)據(jù)庫涌現(xiàn),而eggNOG就是目前使用最廣泛的數(shù)據(jù)庫之一。
官網(wǎng)如下
http://eggnogdb.embl.de/#/app/home
eggNOG全稱evolutionary genealogy of genes:Non-supervised Orthologous, 在COG算法的基礎(chǔ)上進(jìn)行了拓展和延伸,采用基于圖狀結(jié)構(gòu)的非監(jiān)督聚類算法,構(gòu)建了真核,原核,病毒等不同物種的同源蛋白簇。
該數(shù)據(jù)庫最新版本為eggNOG 4.5.1, 涵蓋了2031種真核和原核生物,352種病毒,構(gòu)建了19萬個同源蛋白簇。
和COG類似,eggNOG對于orthology group的功能也進(jìn)行了分類整理,每個類別用一個字母表示,在以下鏈接可以查看具體的分類信息
http://eggnogdb.embl.de/download/eggnog_4.5/COG_functional_categories.txt
COG數(shù)據(jù)庫中提供了26種分類,eggNOG中提供了25種分類,缺少了如下類別
X Mobilome: prophages, transposons
其他的分類和COG數(shù)據(jù)庫完全一致。在官網(wǎng)的搜索框中可以對OG編號進(jìn)行檢索
COG5157
的檢索結(jié)果如下
在檢索結(jié)果中,可以查看該orthology group下包含的蛋白序列和物種信息,也可以下載對應(yīng)的序列。除此之外,還提供了GO, KEGG, pfam, SMRT等相關(guān)的功能注釋信息。
除了在線檢索外,官方還提供了API服務(wù),方便程序抓取對應(yīng)數(shù)據(jù),示例如下
http://eggnogapi.embl.de/nog_data/text/fasta/ENOG410ZSWV
通過以上API鏈接,可以獲得ENOG410ZSWV這個orthology group下的所有蛋白序列,更多用法請參考官方文檔。
官網(wǎng)還提供了以下兩種注釋服務(wù)
一次只支持一條序列的查詢,輸入fasta格式的蛋白序列,選擇對應(yīng)物種即可
支持多條序列的NOG注釋,提供了在線服務(wù),也可以下載軟件到本地運行。
支持diamond和hmmer兩種比對軟件,當(dāng)序列條數(shù)少于1000條時,選擇hmmer,當(dāng)序列多余1000條時,選擇diamond, 速度更快。本地版的eggNOG-mapper 的安裝和使用可以參考如下文檔
https://github.com/jhcepas/eggnog-mapper/wiki
官網(wǎng)提供了下載服務(wù),可以下載完整數(shù)據(jù)庫,也可以根據(jù)物種挑選合適的子數(shù)據(jù)庫進(jìn)行下載,示意如下
通過eggNOG數(shù)據(jù)庫,我們可以對新的蛋白序列進(jìn)行同源蛋白的注釋, 挖掘其功能。
關(guān)于“eggNOG數(shù)據(jù)庫有什么用”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。