小編給大家分享一下minfi是什么,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創(chuàng)新互聯(lián)建站主營(yíng)洛浦網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,成都App制作,洛浦h5微信小程序定制開(kāi)發(fā)搭建,洛浦網(wǎng)站營(yíng)銷推廣歡迎洛浦等地區(qū)企業(yè)咨詢
minfi 是一個(gè)用于分析DNA 甲基化芯片的R包。官網(wǎng)如下:
http://www.bioconductor.org/packages/release/bioc/html/minfi.html
如果要用這個(gè)包進(jìn)行分析,首先需要在R中將我們的芯片數(shù)據(jù)讀取進(jìn)來(lái),就是常說(shuō)的import data
。對(duì)于minfi 來(lái)說(shuō),其設(shè)計(jì)思路是通過(guò)讀取SampleSheet.csv 文件,在事先約定好的目錄結(jié)構(gòu)中查找所有樣本的原始數(shù)據(jù),來(lái)自動(dòng)化的讀取所有樣本的信息。
在illumina 的官方網(wǎng)站,我們可以找到對(duì)應(yīng)的SampleSheet 文件的模板和測(cè)試數(shù)據(jù)集
850K:
https://support.illumina.com/array/array_kits/infinium-methylationepic-beadchip-kit/downloads.html
450K :
https://support.illumina.com/array/array_kits/infinium_humanmethylation450_beadchip_kit/downloads.html
450K 芯片的SampleSheet.csv 模板示例如下:
在SampelSheet 文件中, 開(kāi)頭的幾行是注釋信息,[Data]
下面的樣本的基本信息。
一張甲基化芯片上最多可以有12個(gè)樣本,每個(gè)樣本根據(jù)Sentrix_Position
標(biāo)識(shí), 當(dāng)樣本個(gè)數(shù)大于12個(gè)時(shí),必然需要另外一張芯片,對(duì)于每張芯片,使用Sentrix_ID
標(biāo)識(shí)。minfi
就是通過(guò) Sentrix_ID 和 Sentrix_Position 這兩個(gè)字段來(lái)查找樣本的原始數(shù)據(jù)。
對(duì)于每個(gè)樣本,會(huì)有兩個(gè).idat 文件,基于示例的SampleSheet.csv 文件,對(duì)應(yīng)的文件名稱為
200514040030_R01C01_Grn.idat 200514040030_R02C01_Red.idat
我們只需要整理成如下所示的目錄結(jié)構(gòu)就可以了
SampleSheet.csv Sentrix_ID/ ├── Sentrix_ID_Sentrix_Position.Grn.idat └── Sentrix_ID_Sentrix_Position.Red.idat
SampleSheet.csv 文件在第一層,然后是每張芯片對(duì)應(yīng)的的Sentrix_ID
是一個(gè)目錄,在每個(gè)Sentrix_ID
目錄下,是該芯片上樣本的原始數(shù)據(jù),文件名稱為 Sentrix_ID_Sentrix_Position.Grn.idat
這種格式。
整理SampleSheet.csv 文件和對(duì)應(yīng)的目錄結(jié)構(gòu)之后,就可以在R中進(jìn)行讀取了。
read.metharray.sheet
函數(shù)讀取SampleSheet.csv 文件, 第一個(gè)參數(shù)為該文件所在的目錄,第二個(gè)參數(shù)為文件的名稱,支持正則表達(dá)式,如果不習(xí)慣正則,直接指定為對(duì)應(yīng)的文件名稱就好了。
read in the sample sheet for the experiment
targets <- read.metharray.sheet(dataDirectory, pattern=”SampleSheet.csv”)
read.metharray.exp
函數(shù)讀取樣本的.idat 文件,參數(shù)read.metharraty.sheet
返回的對(duì)象
read in the raw data from the IDAT files
rgSet <- read.metharray.exp(targets=targets)
通過(guò)上面兩步,就實(shí)現(xiàn)了數(shù)據(jù)的讀取。
以上是“minfi是什么”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!