8.8 Seurat v3, 3’ 10k PBMC和全血STRT-Seq尽管我们的/data文件夹中已经有了所有必要的文件,我们仍可以从GEO数据库下载必要的文件: 接下来...
8.8 Seurat v3, 3’ 10k PBMC和全血STRT-Seq尽管我们的/data文件夹中已经有了所有必要的文件,我们仍可以从GEO数据库下载必要的文件: 接下来...
8.6 Harmony, 3’ vs 5’ 10k PBMC使用harmony比任何其他方法都要快得多,并且在最近的标准测试中发现其表现相当好,还可以方便地与Seurat交互...
单细胞注释这个主题太宏大了,而且不是仅靠一个软件一个命令能解决的。目前来看方法可以归为两类,一类是筛选marker基因结合一些自动注释软件进行手动注释,这需要积累大量的文献;另一类就是与已注释好的数据集进行映射,辅助注释自己的数据。无论哪种都需要大量背景知识的支撑。建议去查阅一些高分的单细胞图谱文章,看下他们是如何做的。
重生之我在剑桥大学学习单细胞RNA-seq分析——6. 生物学分析(2)6.2 聚类示例 为了说明scRNA-seq数据的聚类,我们使用发育中的小鼠胚胎细胞的Deng数据集(Deng等,2014)。我们已经预处理了数据集并创建了一个SingleC...
8.4 真实数据集的整合实例有很多关于整合标准的文章发表,最详细的文章(Tran,2020)使用不同大小和复杂程度的多个模拟和真实数据集比较了14种scRNA-seq数据集整...
8.1 简介随着可用的scRNA-seq数据集越来越多,在它们之间进行合并比较是关键。比较scRNA-seq数据集有两种主要方法。第一种方法是“以标签为中心”,其重点是通过比...
7.5 使用SingleR进行细胞类型注释基于我们找到的marker,我们可以挖掘文献并鉴定每种观察到的细胞类型。我们也可以尝试使用SingleR进行自动注释。首先从cell...
7.3 SCTransform标准化和聚类由于我们已经通过额外的QC去除了双胞和空细胞,现在可以应用SCTransform标准化,这有利于通过提高信噪比来寻找稀有细胞群。SC...
为了进一步分析,我们需要对数据进行标准化,以消除测序深度的影响。传统方法是将其缩放到10,000,然后对获得的值进行log2转换。标准化数据存储在“RNA” assay的sr...
本章将介绍使用Seurat(V3)的一些典型任务。尽管Seurat目前已经更新至V5版本,但仍不妨碍我们从此教程中学习一些基本操作及分析思想。现在让我们加载本教程所需的所有库...
6.4 真实数据集中的DE 6.4.1 简介为了测试不同的单细胞差异表达方法,我们将使用Blischak数据集。在该实验中,除了单细胞数据之外,还生成了每个细胞系的Bulk ...
6.3 差异表达(DE)分析6.3.1 Bulk RNA-seq处理Bulk RNA测序数据时最常见的分析之一是识别差异表达基因。通过比较两种条件下发生变化的基因,例如突变型...
6.2 聚类示例 为了说明scRNA-seq数据的聚类,我们使用发育中的小鼠胚胎细胞的Deng数据集(Deng等,2014)。我们已经预处理了数据集并创建了一个SingleC...
6.1 聚类介绍当我们标准化数据并消除了混杂因素,我们就可以进行与当前生物学问题相关的分析。分析的具体性质取决于数据。不过,有些分析在广泛的背景下很有用,我们将在接下来的几章...
5.6 处理混杂因素5.6.1 简介在上一章中,我们根据文库大小进行了标准化,有效地将其作为混杂因素去除。现在,我们将从数据中去除其他定义不太明确的混杂因素。技术混杂因素(又...
5.5 标准化实践我们继续使用Tung数据(下载地址:https://singlecellcourse.cog.sanger.ac.uk/index.html?shared=...
5.4 标准化理论5.4.1 简介在上一章中,我们确定了重要的混杂因素和解释变量。scater允许在后续的统计模型中考虑这些变量,或者根据需要使用normaliseExprs...
5.3 识别混淆因子5.3.1 简介ScRNA-seq数据中存在大量潜在的混杂因素和误差。分析scRNA-seq数据的主要挑战之一在于难以进行真正的技术重复来区分生物和技术差...
5.2 数据可视化与降维5.2.1 简介在本章中,我们将继续使用上一章生成的过滤后的Tung数据集。我们将探索可视化数据的不同方式,以便评估质控步骤后表达矩阵发生的变化。sc...
5.1 数据集构建和质控5.1.1 简介基因表达定量后形成一个表达矩阵,其中每一行对应一个基因(或转录本),每一列对应一个细胞。下一步我们将检查矩阵以去除低质量的细胞。在此阶...
4.2.3 矩阵统计因为SingleCellExperiment对象中存储的主要数据是一个矩阵,所以覆盖矩阵行或列间汇总指标的函数很有用。有几个函数可以做到这一点,详细信息请...