空间转录组第四讲:最详细的10x空间转录组summary网页报告解读

一般我们拿到10x空间转录组数据分析的结果最先看的肯定是web_summary网页报告,因为从这个结果里面我们大概就能判断你的数据好不好,不好的问题在哪里,数据到底能不能用等等。这里来详细介绍一下怎么看10x 空间转录组web_summary网页版报告。

10x ****空间转录组网页版报告模板如下:

图片

下面来详细介绍一下每块区域每个指标的含义。

Reads****总体情况统计区:

图片

Number of Reads****:样本总的测序reads数,双端测序这个是指一端的reads数,实际上算数据量需要用reads2读长。

Valid Barcodes****:barcode校准后有效的barcode数占总的reads的比例,Space Ranger会先尝试纠正barcode序列中的序列错误,然后再进行统计。

Valid UMIs****:有效的UMI数占总的reads的比例。

Sequencing Saturation****:测序饱和度值,就是在当前测序深度情况下,有多少比例的捕获到的mRNA被测出来了,比如这这里的测序饱和度是74%,说有74%的mRNA基因被检测出来了,如果加大测序深度会有更多的mRNA被检测出来。

Q30 Bases in Barcode:barcode序列的Q30值

Q30 Bases in RNA Read****:捕获的mRNA序列的Q30值

Q30 Bases in UMI****:UMI序列的Q30值

Mapping****结果统计区:

图片

Reads Mapped to Genome****:比对到基因组上reads的比例

Reads Mapped Confidently to Genome****:唯一比对到基因组上reads的比例,也就是我们常说的mapped uniquely reads,不过这里如果某条reds唯一比对到一个基因的exon区,同时又比对到了一处非exon区,还是算唯一比对到exon区的reads。

Reads Mapped Confidently to Intergenic Regions****:比对到唯一基因间区的reads的比例

Reads Mapped Confidently to Intronic Regions****:比对到唯一内含子区的reads的比例

Reads Mapped Confidently to Exonic Regions****:比对到唯一外显子区的reads的比例

Reads Mapped Confidently toTranscriptome****:比对到唯一基因转录组上reads的比例,这一部分会包括剪切位点的reads。这一部分的reads就是用来对UMI进行计数统计的。细心的朋友们可能会发现这一部分的reads比例比Reads Mapped Confidently to Exonic Regions的值要低,这是因为有些基因的exon是有overlap的,处于overlap区域的reads最终是不进入UMI计数的。

Reads Mapped Antisense to Gene****:比对到基因转录组的反义链区域的reads比例,这部分reads是没有意义的。从这里我们也可以发现10x空间转录组建库和比对是有方向性的。

Spot****信息统计区:

图片

Fraction Reads in Spots Under Tissue****:比对到唯一基因转录组上reads(Reads Mapped Confidently to Transcriptome)有多少比例覆盖在组织区域的spot上,这里是93%,那就说明只有7%的reads分布在组织之外的灰色区域的。10x软件在这里有一个默认的阈值为50%,认为这个比例值超过50%结果是正常的,低于50%则回到网页最上面区域提示报错信息(认为可能是透化不完全导致背景RNA过高或者是组织区域选的不合适)。从这个50%的阈值上我们也可以判断10x的这个空间转录组技术还是存在一定缺陷的,它允许接近50%的reads散落在组织以外的区域,说明组织透化这一步想让对应区域的mRNA完全都落入对应spot点里面去还是很难的。

Mean Reads per Spot****:每个spot的平均reads数,10x这里采用的是所以测序reads总是除以组织上检测到的spot数(跟单细胞的统计方法是一样的),理论上来说这样统计是不合理的,因为总的reads包括没有比对上的reads、没有mapping到转录本上的reads、组织区域以外的spot上的reads,所以是不能真实的反应每个spot上实际的reads数的。

Median Genes per Spot****:每个spot的基因中位数

Total Genes Detected****:检测到的基因总数

Median UMI Counts per Spot****:每个spot的中位UMI数

样本信息区:

图片

Sample ID****:样本id

Chemistry ****:试剂版本

Slide Serial Number ****:Slide信号和区域

Reference Path****:参考基因组路径

Transcriptome****:基因组转录组版本

Pipeline Version****:spaceranger软件版本

Analysis****区域

图片

UMI****分布展示:左边是图像上UMI的分布,右边是tsne降维可视化后的UMI的分布,鼠标放置到图像上会现在对应的位置信息和对应spot上的UMI count数。从这个图我们可以判断UMI主要分布在组织的哪些区域,哪些区域没有捕获到mRNA或捕获的mRNA特别少。

图片

Cluster****的分布展示:左边是cluster在组织图像上的分布,右边是tsne降维可视化后的cluster的分布,鼠标放置到图像上会现在对应的位置信息和对应spot上的cluster值和该cluster占总的spot的比例。这个图片上cluster分群在组织上的层次关系特别明显。

图片

这一部分主要展示亚群的top基因的信息,因为不管是单细胞还是空间转录组基本上后面都会自己另外重新分析的,所以这部分和上面的cluster分布信息意义不大。

图片

Sequencing Saturation****(测序饱和度)

对reads进行随机抽样,观察不同spot平均reads的情况下测序饱和度的分析,一直到实际的测序深度测序饱和度的值,理论上当所有转化的mRNA转录本均已测序后,饱和度接近1.0(100%),虚线表示测序到合理的饱和点位置,也就是说就是测序深度再高也不可能饱和度达到100%。

Median Genes per Spot****(sopt点的中位基因)

也是对reads进行随机抽样,观察不同spot平均reads的情况下spot的中位基因的值,曲线最高点的斜率能反应增加测序深度能得到最大的spot的中位基因数。

总结

对于web_summary的结果我们大概重点可以从下面几个方面来看数据效果

1、总的spot数,这个其实由组织的大小而定,没有具体好坏的说法;

2、每个spot的中位基因数,中位基因数太少说明捕获效果不好,有可能透化步骤条件不够优化,当然也有可能是试剂或芯片的问题;

3、测序饱和度,每个点的UMI中位数,sopt平均reads数,饱和度、sopt平均reads数和中位UMI数都太低说明测序深度不够,需要加大测序量。

4、基因组的比对率,比对率太低有可能是样品污染;

5、组织spot上reads的比例,比对太低有可能透化时间不够导致背景RNA过高,需要优化透化条件,也有可能组织区域选的不好,这个可以通过LoupeBrowser手动选择组织区域。

转载来自:https://mp.weixin.qq.com/s?__biz=MzUzOTUxOTMxMg==&mid=2247483802&idx=1&sn=d0b24d592123137bb4130be626e72492&chksm=fac671a5cdb1f8b3410634fc0b1114747e7e722c9e8c2b97bdfb486fb0fc93ed85bcc95d7186&scene=21#wechat_redirect

最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事?!?“怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容