如何使用cell ranger進行單細胞轉(zhuǎn)錄組定量分析,針對這個問題,這篇文章詳細介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
企業(yè)建站必須是能夠以充分展現(xiàn)企業(yè)形象為主要目的,是企業(yè)文化與產(chǎn)品對外擴展宣傳的重要窗口,一個合格的網(wǎng)站不僅僅能為公司帶來巨大的互聯(lián)網(wǎng)上的收集和信息發(fā)布平臺,成都創(chuàng)新互聯(lián)公司面向各種領(lǐng)域:成都效果圖設(shè)計等網(wǎng)站設(shè)計、全網(wǎng)營銷推廣解決方案、網(wǎng)站設(shè)計等建站排名服務(wù)。
在RNA_seq數(shù)據(jù)的定量分析中,都是首先將reads比對到參考基因組,然后再使用定量軟件進行定量,比如經(jīng)典的hisat+stringTie的分析策略,對于單細胞轉(zhuǎn)錄組而言,其定量的原理也是一樣的,只不過由于引入了UMI
標簽的設(shè)計,在定量時需要考慮相同UMI
標簽來自同一個轉(zhuǎn)錄本,直接使用傳統(tǒng)的分析軟件就不合適了。
官方提供的cell ranger軟件不僅提供了數(shù)據(jù)拆分,也提供了定量等分析內(nèi)容。
定量的前提都是需要將reads比對到參考基因組上,對于比對而言,第一步都是先對參考基因組建立索引,官網(wǎng)提供了人和小鼠的參考基因組供下載,網(wǎng)址如下
https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
對于其他物種,我們只需要有基因組的fasta文件和轉(zhuǎn)錄本的gtf文件,就可以自定義參考基因組,步驟如下
在原始的GTF文件中,會包含非常多類型的基因,可以通過mkgtf
子命令,篩選其中感興趣的基因,用法如下
cellranger mkgtf \ hg38.ensembl.gtf \ hg38.ensembl.filtered.gtf \ --attribute=gene_biotype:protein_coding
通過attribute
屬性來篩選,上述例子中只篩選出蛋白編碼基因?qū)?yīng)的記錄。
通過mkref
子命令來建索引,用法如下
cellranger mkref \ --genome=output_genome \ --nthreads=10 \ --fasta=input.fa \ --genes=input.gtf
genome
參數(shù)指定輸出結(jié)果的目錄,建好索引之后的目錄結(jié)構(gòu)如下
. ├── fasta │ ├── genome.fa │ └── genome.fa.fai ├── genes │ └── genes.gtf ├── pickle │ └── genes.pickle ├── reference.json └── star
可以看到,cell ranger對基因組建立了STAR
的索引,然后通過STAR
將reads比對到參考基因組上。
定量分析通過count
子命令實現(xiàn),用法如下
cellranger count \ --id=sample345 \ --transcriptome=database_path \ --fastqs=fastq_path \ --sample=mysample \
id
參數(shù)指定輸出目錄的名字,transcriptome
參數(shù)指定基因組索引所在目錄,fastqs
指定mkfastq
命令產(chǎn)生的序列文件所在目錄,sample
參數(shù)指定需要分析的樣本,在fastq_path
下對應(yīng)一個子目錄。
count
子命令不僅可以進行定量分析,還提供了聚類,PCA, tSNE等一系列分析結(jié)果,輸出結(jié)果目的錄下文件很多,在后續(xù)我們會詳細解讀該命令的輸出結(jié)果。
關(guān)于如何使用cell ranger進行單細胞轉(zhuǎn)錄組定量分析問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。