主要有两种形式:
1.一个样本的所有scRNA-seq数据(或者随机选一部分数据)合并成一个样本的bulk数据,比较不同样本。
2.scRNA-seq的某个或某种细胞簇下面的所有细胞合并成一个样本的bulk数据,比较不同细胞类型。
前述文章图片的数据就是把心肌细胞的三个亚类(CM1、CM2、CM3)按照不同疾病类型(Control、TOF、DCM等)合并,使用PCA进行评估展示,发现CHD diagnosis是样本间的主要差异来源。
实现方法:
- R包:muscat,封装好的函数直接用。
- 像文章中一样,利用aggregate函数分组统计,将单细胞数据整合成bulk数据,之后用Deseq2等方法分析差异。
参考文献:Nature, 2022, 608, 181–191.
Nature Communications, 2021, 12, 5692.