前面我給大家詳細(xì)介紹過
創(chuàng)新互聯(lián)專注于磴口網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供磴口營(yíng)銷型網(wǎng)站建設(shè),磴口網(wǎng)站制作、磴口網(wǎng)頁設(shè)計(jì)、磴口網(wǎng)站官網(wǎng)定制、微信小程序服務(wù),打造磴口網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供磴口網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。
?GO簡(jiǎn)介及GO富集結(jié)果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結(jié)果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個(gè)包繪制GO富集分析氣泡圖和柱形圖的時(shí)候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個(gè)圖別說美觀了,簡(jiǎn)直不忍直視。經(jīng)過我的認(rèn)真研究,發(fā)現(xiàn)跟R版本有關(guān)。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應(yīng)的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關(guān)的函數(shù)拿出來認(rèn)真的研究了一下,終于發(fā)現(xiàn)的癥結(jié)所在。
dotplot這個(gè)函數(shù),多了個(gè) label_format 參數(shù)
我們來看看這個(gè)參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個(gè)參數(shù)默認(rèn)值是30,當(dāng)標(biāo)簽的長(zhǎng)度大于30個(gè)字符就會(huì)被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下這個(gè)參數(shù),把他設(shè)置成100,讓我們的標(biāo)簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復(fù)原來的容貌。
關(guān)于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
當(dāng)富集分析完成,拿到如下的分析結(jié)果后,就可以進(jìn)行作圖了。
富集分析結(jié)果的可視化無非就是柱狀圖和氣泡圖,但是公司默認(rèn)出圖實(shí)在是太丑,所以還是自己動(dòng)手修改修改。
一、常規(guī)柱狀圖(ggplot2)
橫軸為gene counts,或者用-logP也行,填充相應(yīng)的用P值或者gene counts。ggplot畫圖的好處就是可以進(jìn)行很多調(diào)整。
二、常規(guī)氣泡圖(ggplot2)
氣泡圖與柱狀圖如出一轍,只是在展示方式上出現(xiàn)了差別。一個(gè)用geom_bar()函數(shù),氣泡圖類似于散點(diǎn)圖用geom_point()函數(shù)。
三、上下調(diào)同時(shí)展示(ggplot2)
很多時(shí)候研究者拿到差異基因后,上下調(diào)基因是分別富集的,在展示上需要同時(shí)體現(xiàn)二者,我們之前提到metascape可以做到: 轉(zhuǎn)錄組不求人系列(十二): Cell文章最喜歡用的差異基因GO、KEGG富集分析工具 ,除此之外,之前講過的氣泡圖也可以展現(xiàn)多組的結(jié)果: 復(fù)現(xiàn)《nature communications》圖表(四):ggplot畫多組富集氣泡圖 。這里我們繼續(xù)提供一種bar圖的展示方式。將down的數(shù)值調(diào)整為負(fù),做一列分組,就可以展示了。
當(dāng)然了,以上所說的可視化還是比較常規(guī),在基礎(chǔ)上可以自己做調(diào)整。也有一些文章總是標(biāo)新立意,有很多奇特的展現(xiàn)方式,我們會(huì)在之后的系列中講解。
單細(xì)胞富集分析系列:
單細(xì)胞富集分析我最常用的是 分組GSVA ,但最近用到了GO分析,就復(fù)習(xí)一下GO和KEGG富集分析及繪圖。
載入無比熟悉的pbmc.3k數(shù)據(jù)集 (已注釋好,數(shù)據(jù)準(zhǔn)備見 monocle )
pbmc3k數(shù)據(jù)集只有1個(gè)樣本,沒辦法區(qū)分HC和病例組。
若有分組,可以使用subset函數(shù)將某種細(xì)胞取出,來做這種細(xì)胞病例組和對(duì)照組相比的差異基因和富集分析
之所以長(zhǎng)短不齊不按順序是因?yàn)闆]有排序
排完續(xù)之后再畫p值就是按順序的了
附: 單細(xì)胞測(cè)序數(shù)據(jù)的差異表達(dá)分析方法總結(jié)
2018年SCI論文--整合GEO數(shù)據(jù)挖掘完整復(fù)現(xiàn) 七 :DAVID在線工具進(jìn)行KEGG富集分析_bioprogrammer-CSDN博客
“差異基因kegg注釋圖”是轉(zhuǎn)錄組分析結(jié)果的重要組成部分,能夠幫助大家了解差異基因分屬于哪些代謝通路,文章中如果能夠插入下面這類圖來說明樣品間的差異,一定會(huì)為你的文章增色不少。
下面給大家介紹一下如何在Windows下對(duì)差異基因進(jìn)行kegg注釋。
一、輸入數(shù)據(jù)準(zhǔn)備:
首先要準(zhǔn)備的是各比較組(比如CK1比上Treat1)的差異基因列表,一般公司做完的標(biāo)準(zhǔn)分析結(jié)果里已經(jīng)包含這部分內(nèi)容了,通常在“DEG_Analysis”文件夾里,我們用到的信息是“ 基因ID ”和“ regulated ”(up代表上調(diào),down代表下調(diào))兩列,如下圖所示的第一列和最后一列:
接下來需要添加一列,將“regulated”里的“up”標(biāo)記成“red”,“down”標(biāo)記成“green”,這樣后面做出來的kegg注釋圖里上調(diào)基因就會(huì)顯示為紅色,下調(diào)基因顯示為綠色。具體方法是在第三列插入一個(gè)“ if ”函數(shù),當(dāng)?shù)诙兄禐椤皍p”時(shí)輸出“red”,否則輸出“green”,參數(shù)設(shè)置詳見下圖:
這樣C2單元格就會(huì)顯示為“red”,雙擊該單元格右下角,這樣C列就都按上面的規(guī)則填充好了,如下圖所示:
二、在作圖網(wǎng)站填入數(shù)據(jù):
打開網(wǎng)站:
按照下方設(shè)置好參數(shù),并將第一步準(zhǔn)備好的Excel表里的第一和第三列數(shù)據(jù)粘貼進(jìn)去(注意:Excel表的 第一行 和 第二列 都不用粘貼),點(diǎn)擊左下角的“exec”按鈕開始運(yùn)算。根據(jù)您提交的基因數(shù)量,等待一小段時(shí)間結(jié)果就出來了:
注釋到的代謝通路結(jié)果,按數(shù)量排序:
點(diǎn)擊其中的代謝通路鏈接,就能夠看出該代謝通路中哪些基因上調(diào)、哪些基因下調(diào)了。
好的,這樣差異基因的kegg注釋就完成了。掌握之后,便可在幾分鐘之內(nèi)做任意差異基因列表的kegg注釋圖而不用找公司了!
1. 文章越來越難發(fā)?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡(jiǎn)單快速,學(xué)習(xí)鏈接: 基因家族分析實(shí)操課程 、 基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件,學(xué)習(xí)鏈接: 轉(zhuǎn)錄組(有參)結(jié)果解讀 ; 轉(zhuǎn)錄組(無參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次,學(xué)習(xí)鏈接: WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接: 轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘 、 轉(zhuǎn)錄組文獻(xiàn)解讀
5. 微生物16S/ITS/18S分析原理及結(jié)果解讀 、 OTU網(wǎng)絡(luò)圖繪制 、 cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接: linux系統(tǒng)使用 、 perl入門到精通 、 perl語言高級(jí) 、 R語言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接: TCGA-差異基因分析 、 GEO芯片數(shù)據(jù)挖掘 、 GSEA富集分析課程 、 TCGA臨床數(shù)據(jù)生存分析 、 TCGA-轉(zhuǎn)錄因子分析 、 TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接: 二代測(cè)序轉(zhuǎn)錄組數(shù)據(jù)自主分析 、 NCBI數(shù)據(jù)上傳 、 二代測(cè)序數(shù)據(jù)解讀 。
之前分享了如何用ggplot2可視化GO分析的結(jié)果。既然做了GO,當(dāng)然少不了KEGG了。
同樣的,我們從 DAVID 獲取KEGG pathway的結(jié)果。
對(duì)于KEGG,我比較喜歡做氣泡圖,這樣用兩種形式的圖結(jié)合在一起,效果更豐富更好看一點(diǎn)。