R语言DESeq2包
R语言DESeq2包介绍
DESeq2包是为高维计数教据的归一化,可视化和差分分析而设计的。它利用经验贝叶斯技术对数折矗变化和离散的先验,并计算这些量的冠验估计。分析RNA序列数据的主要任务是探测基因差异,而应用EDSeq中可以利用二项分布和收缩的分布方程估计.
DESeq2的差异表达分析涉及多个步骤:
简单的说——DESeq2将对原始reads进行建模,使用标准化因子(scale factor)来解释库深度的差异。然后,DESeq2估计基因的离散度,并缩小这些估计值以生成更准确的离散度估计,从而对reads count进行建模。最后,DESeq2拟合负二项分布的模型,并使用Wald检验或似然比检验进行假设检验。
包的安装
首先在库中查询,确定包不是自带的也没有安装
第一种安装方法失败
第二种安装方法:网上查阅资料找到扩展包的网站
访问此网站得到
输入以上代码重新开始安装DESeq包
安装中出现小故障输入n快速解决
成功安装DESeq
CollapseReplicates函数及应用
函数功能
折叠复制:折叠范围汇总实验或 DESeq 数据集中的技术复制
描述
通过在分组因子分组的级别内求和来折叠对象中的列。此函数的目的是汇总来自技术重复的读取计数,以创建一个对象,其中包含每个样本的单个读取计数列。(可选)使用分组因子的水平重命名返回对象的列。注意:这个函数写得非常简单,可以通过检查源代码来轻松更改以产生其他行为。
用法
应用例子
源代码:
dds <- makeExampleDESeqDataSet(m=12)
# make data with two technical replicates for three samples
dds$sample <- factor(sample(paste0("sample",rep(1:9,c(2,1,1,2,1,1,2,1,1)))))
dds$run <- paste0("run",1:12)
ddsColl <-collapseReplicates(dds,dds$sample, dds$run)
# examine the colData and column names of the collapseddata
colData(ddsColl)
colnames(ddsColl)
# check that the sum of the counts for "sample1" is the same
# as the counts in the "sample1" column in ddsColl
matchFirstLevel <- dds$sample == levels(dds$sample)[1]
stopifnot(all(rowSums(counts(dds[,matchFirstLevel])) == counts(ddsColl[,1])))