最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。氣泡圖 柱形圖 這個圖別說美觀了,簡直不忍直視。經過我的認真研究,發(fā)現(xiàn)跟R版本有關。
創(chuàng)新互聯(lián)是專業(yè)的撫州網(wǎng)站建設公司,撫州接單;提供成都網(wǎng)站設計、做網(wǎng)站、成都外貿網(wǎng)站建設公司,網(wǎng)頁設計,網(wǎng)站設計,建網(wǎng)站,PHP網(wǎng)站建設等專業(yè)做網(wǎng)站服務;采用PHP框架,可快速的進行撫州網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
但是該方法存在一個很大的問題,那就是當x軸標簽數(shù)量很多時,那么就無法通過這樣的方法進行解決了。方法二是方法一的逆向思路,既然可以調大畫布,那么反過來,我們也可以調小x軸標簽字體。
單細胞富集分析我最常用的是 分組GSVA ,但最近用到了GO分析,就復習一下GO和KEGG富集分析及繪圖。載入無比熟悉的pbmc.3k數(shù)據(jù)集 (已注釋好,數(shù)據(jù)準備見 monocle )pbmc3k數(shù)據(jù)集只有1個樣本,沒辦法區(qū)分HC和病例組。
1、用#表示。據(jù)查csdn博客網(wǎng),一般編程語言的注釋分為單行注釋與多行注釋,但是R語言只支持單行注釋,注釋符號為#。
2、R語言中小數(shù)點是組成變量名的普通符號。但它有另一個功能 是S3對象的函數(shù)多態(tài)。 例如 你輸入as.numeric 按下tab鍵會發(fā)現(xiàn)很多以as.numeric.開始的函數(shù) as.numeric() 函數(shù)根據(jù) 參數(shù)類型不同自動調用的函數(shù)。
3、4 特殊符號 有時候需要在圖上標注諸如求和、積分、上下標等數(shù)學符號,還有一些公式等。這里需要用到函數(shù)expression(...),...是要輸入的表達式。 可以通過help(plotmath)以獲得更多表達式的細節(jié)和示例。
4、兩個需要放在一起的符號可以用星號代替連接起來,如果表達式中有文字排版的話,可以用那種函數(shù)將其連接起來,兩種字體加粗傾斜。
5、R語言初學指南可在腳本中加入注釋。在腳本中,任何以“#”(sharp/numbersymbol)開頭的命令行都會被R忽略。同樣,若“#”出現(xiàn)在某行的中間,則該行中“#”后面的語句都會被忽略。
1、3 GO富集分析 加載了注釋庫之后,讀取基因列表文件,并使用clusterProfiler的內部函數(shù)enrichGO()即可完成GO富集分析。讀取基因列表文件,并使用clusterProfiler的內部函數(shù)enrichKEGG()即可完成KEGG富集分析。
2、前景基因:指的是我們所要進行富集的基因,一般是基因的ID 背景基因:指的是前景基因在某個基因集合進行富集,這個基因集合就是背景基因 描述信息:每個GO的Term的屬性,或者是每個KO號或者map號的屬性。
3、安裝clusterProfiler:對于沒有轉換的gene ID,clusterProfiler也提供了 bitr 方法進行轉換ID:可以看到,這里轉換ID的對應文件來源于org.Hs.eg.db這個包。
4、把他設置成100,讓我們的標簽可以一行展示。是不是還是原來的配方,還是熟悉的味道 同樣的柱形圖,我們也能讓他恢復原來的容貌。
5、scale_y_discrete則調節(jié)label過長的情況,讓圖片看起來 更美觀。3)檢查結果,可見geneID展示為gene symbol。(1)在enrichGO函數(shù)中,設置readable = TRUE;(2)用setReadable函數(shù),對GO或者KEGG結果進行轉化即可。
6、例如,討論這些差異基因主要映射到哪些GO或KEGG分類條目中,以說明基因表達的改變會導致哪些調控途徑原有功能失調,進而與表型聯(lián)系起來。通常稱這種分析為GO、KEGG富集分析。