Comparisons of accessibility across developmental stages:
跨发育阶段的染色质可及性比较:
我们接下来询问是否跨发育阶段共享特定于细胞类型的基序富集。许多相似的细胞类型在小鼠 ATAC 图谱中显示出相似的top motifs,该图谱是通过分析 8 周龄小鼠的 13 个组织产生的 (13),这意味着这些 TF 在细胞命运维持中发挥作用,可能跨物种保守(小鼠与人类)以及发育阶段(成人与胎儿)(图 S15,A 和 B)。 POU2F1——我们认为对神经元细胞很重要的基序——除了 B 细胞外,还富含小鼠兴奋性神经元的可及部位(图 S15A)。
Motif 富集模式主要按细胞类型而不是共享热图中的物种聚集(图 S15C),但有一些例外。例如,虽然骨髓细胞聚集在一起,但小鼠淋巴细胞与人类淋巴细胞分开聚集,部分原因是小鼠中 NFKB1/2 基序更显着富集。这可能是由于发育阶段的差异,因为 NFKB1 已被证明对于产前 B-1 过渡细胞的出现是可有可无的,但在发育后期却是必不可少的 (83)。
为了研究人类发育阶段特定的染色质可及性,我们将我们的数据集与成人组织中现有的单细胞 ATAC 数据集进行了比较,即血液和皮质 (84, 85)。为了消除观察到的强烈批次效应,我们选择了成人数据集中的overlapping peaks,根据该峰集重新评分我们的数据,识别锚点,并整合两个数据集(图 S16A)(23)。
应用这种整合策略后,血细胞按细胞类型而不是阶段聚集,胎儿细胞在 UMAP 可视化中更接近原始亚型(图 S16B)。与小鼠图谱的比较一样,正如我们所询问的相对较晚的发育阶段所预期的那样,我们观察到在许多血细胞类型中丰富的相似基序,但存在一些差异(图 S16C)。
同样,成人 B 和 T 细胞更富含 NFKB1/2(成人 B 和 T 细胞为 1.5 至 1.6 倍,胎儿 B 细胞为 1.1 倍;胎儿 T 细胞未显示富集)。然而,由于不同的样本收集和处理以及消除了集成工作流程中潜在有意义的特定于数据集的差异,这种比较受到强烈的批量效应的阻碍。
在我们比较发育和成人皮层数据 (85) 时,在集成的 UMAP 表示中再次有几种细胞类型重叠(图 S17A)。然而,一些胎儿亚簇,包括两个最大的兴奋性神经元亚簇,与成人数据(亚组 1 和 2)不重叠(图 S17B)。胎儿大脑 UMAP 包含的亚结构比我们注释的更多(其他组织和细胞类型也是如此),这可以通过已知神经元亚型标记基因的簇特异性可及性来证明(图 2B 和图 S17C)。对于更深入的分析作为细胞类型之一,我们试图进一步注释最常见的胎儿脑细胞类型的亚簇:兴奋性神经元。
为此,我们首先使用来自 Allen Brain Atlas 的单细胞表达数据应用了我们基于 NNLS 的细胞类型注释策略,这些数据是在死后成人大脑样本中收集的 (86)。尽管许多集群找到了匹配项,但最大的兴奋性神经元亚簇没有(亚簇 1)(图 S17D)。
相比之下,当使用从发育中的皮层(妊娠 17 至 18 周)(85、87)收集的单细胞表达数据时,我们发现两个最大的兴奋性神经元亚群分别与新形成的迁移和成熟的兴奋性神经元相匹配(亚组 1和 2)(图 S17E)。在迁移种群(亚簇1)特有的前 10 个峰中,四个位于神经元基因的内含子,四个位于非编码 RNA 的内含子,两个位于转录单位的远端,但在脊椎动物中高度保守(图 S18, A 和 B)。后者的一个例子是远端峰(距离最近的 TSS > 20 kb)与在 VISTA 增强子浏览器中列为阴性的保守元件重叠(图 S18A)(80)。
这种更精细的注释还使我们能够研究某些性状的遗传力是否在神经元亚型之间差异富集。与整个数据集相比,我们计算了大脑中每个 Louvain 簇的性状遗传性富集,而不是每种细胞类型。正如预期的那样,我们观察到神经元细胞类型中各种神经学特征的富集,而不是非神经元细胞类型,例如脑内皮细胞(图 S19A)。
在我们广泛注释的细胞类型中,我们观察到不同 Louvain 簇的富集程度不同;例如,抑制性神经元 2 亚型在双相情感障碍的遗传性和男性所生子女的数量方面都非常丰富(图 S19B)。至于兴奋性神经元,我们发现,与迁移或成熟的兴奋性神经元相比,在分化的深层兴奋性神经元的可接近位点中,教育程度的遗传力更加丰富(图 S19C)。相反,厌食症的遗传性在成熟的兴奋性神经元的可接近位点中更加丰富(图 S19C)。
对兴奋性神经元亚簇中差异富集的 TF 基序的观察显示,我们展示的 POU2F1 可能仅限于神经元,在胎儿特异性迁移组中最为丰富,这表明它可能不仅参与维持,而且神经元命运的规范(图6A)。与此一致的是,与 POU2F1 相邻的增强子已被证明在小鼠皮质祖细胞中具有特异性活性 (88)。为了进一步研究兴奋性神经元发育过程中的调控格局,我们接下来生成了一个伪时间轨迹,从过度成熟迁移到分化的深层神经元(图 6、B 和 C)。
来自个体供体的所有兴奋性神经元细胞的中位假时间差异大致对应于胎龄差异(图 6C),尽管个体数量(n = 3)太小,无法详细研究这种个体间异质性。数以千计的兴奋性神经元峰值以伪时间依赖性方式打开或关闭(图 6D)。在伪时间打开的动态可访问元件富集了对神经元成熟很重要的 Rfx 和 Tal 相关因子的motif,而在伪时间关闭的元件则富集了属于成对相关同源域因子和 POU 因子的基序,包括POU2F1(2.2 倍变化,q = 2.3 × 10-4)(图 6E)。这种动态得到匹配的 RNA 数据的支持,其中 POU2F1 表达在兴奋性神经元发育的假时间轨迹早期达到峰值(图 6F)(16)。一旦确定了祖细胞群,对发育特异性细胞群、它们相关的候选调节区和 TF 基序的类似分析可以应用于进一步的组织。