用DESeq2包来对RNA-seq数据进行差异分析

楼主  收藏   举报   帖子创建时间:  2018-04-15 00:00 回复:0 关注量:127

差异分析的套路都是差不多的,大部分设计思想都是继承limma这个包,DESeq2也不例外。

DESeq2是DESeq包的更新版本,看样子应该不会有DESeq3了,哈哈,它的设计思想就是针对count类型的数据。

可以是任意features的count数据,比如对各个基因的count,或者外显子,或者CHIP-seq的一些feature,都可以用来做差异分析。

使用这个包也是需要三个数据:

  • 表达矩阵
  • 分组矩阵
  • 差异比较矩阵

总结起来三个步骤,我下面会一一讲解

  • 重点就是构造一个dds的对象,
  • 然后直接用DESeq函数进行normalization处理即可,
  • 处理之后用results函数来提取差异比较结果。

读取自己的数据

一般我们会自己读取表达矩阵和分组信息,下面是一个例子:

第一步:构建dds对象

那么根据这两个数据就可以构造dds的对象了

可以看到我们构造的dds对象有7个样本,共14470features

从基因名可以看出,是果蝇的测序数据

我们也可以直接从expressionSet这个对象构建dds对象!

第二步:做normalization

差异表达

第三步:提取差异分析结果

差异分析结果很容易看懂啦!

原文来自:www.bio-info-trainee.com