之前在Connectivity Map(cMap)的探索应用(二)中提到了两种cmap在线分析网站,一个是build2 ;另一个是CLUE平台。bulid2在cMAP在线分析——旧版build2的使用 那期已经讲解过,今天就来简单介绍下CLUE平台的使用!由于CLUE平台的功能很多,会分多期讲解。上一期cMAP新版clue的使用——Touchstone已经简单介绍了Touchstone的操作方法,今天开始 Data Library的介绍!
cMAP新版clue在线分析 ,网站:https://clue.io/。
clue的主工具区(Tools)
今天主要介绍Data Library,该工具主要用于探索分析各个数据库。
- 首先点击Tools—Data Library,进入如下界面,网站截至目前共收录11个数据库,共计501237条信息。
- 任选一个数据库进行探索,这里以" CRCGN_ABC" 为例,该数据库定位在致癌生物标志物,点击数据库名称,
进入以下详情页面,界面主要分三块:1-CRCGN_ABC数据库的总概;2-Analysis in clue具体的分析工具;3-Supporting Files。
一、数据库总概述
从这部分可以看到,CRCGN_ABC数据库涉及500个Perturbagens,4个细胞系,6种剂量,3个时间点,3个重复。具体情况可点击Data table查看,这里就展示了CRCGN_ABC数据库共计5996条表达谱信息。接下来,可以选择自己感兴趣的表达谱或者选择后创建list,然后点击Go to anaysis进一步分析,界面向下跳至analysis in clue部分。
二、Analysis in CLUE
1-Touchstone connectivity
跳转至分析部分,第一个就是Touchstone connectivity,大家会发现上面选择的4条记录已经自动填充到"Choose a subset"区域,"Show summary results only"选择与否看自己需求,这里选上为节约时间。然后点击VIEW IN ICV就可以只管查看这四条表达谱记录与touchstone数据库中表达谱的相似性(加载时间很长)。
2-Introspect analysis
还可以使用Introspect analysis查看ICV中的这些perturbagens如何相互连接(加载时间很长)。
3-T-SNE
通过单击t-SNE,您可以查看数据集整体的空间结构,还可以按特定的字段进行颜色和大小自定义显示图。
4-Transcriptional Activity Score (TAS)
通过该分析可以查看所有表达谱记录的TAS值,该值代表该记录是否被激活。一般情况下TAS值>0.2被认为被激活。可以对TAS设置阈值,标记出阈值范围内的记录。
在t-SNE和TAS分析中,都可以将signature保存到列表中,以便以后进行调查。比如对TAS高的一组signature感兴趣,并且希望了解这些signature在Touchstone中与哪些扰动相关。首先套索工具选择这些signature,然后将它们保存到列表中。
最后,回到Data table,点击齿轮按钮,然后选择"Lists"。选择相应list,又可以轮回上面的分析内容。
4-PCA
同t-SNE比较类似,通过单击PCA,可以查看数据集整体的空间结构,也可以按特定的字段进行颜色和大小自定义显示图。
三、Supporting Files
这部分是CRCGN_ABC数据库的下载链接,有需要下载需求的,可以自行下载。
最后衍生
Data Libray目前收录有多个数据库,如果这里面的数据库都不能满足分析需求。比如之前提到的:以CX3CR1+和CX3CR1-基因集为signature,60个单细胞表达谱为参考数据库,看CX3CR1+和CX3CR1-这组signature与60例单细胞数据的相似性,从而评估这些细胞的类型,哪些属于CX3CR1+,哪些属于CX3CR1-?要完成这项分析,如何构建60个细胞的参考数据库?
经查询,CLUE平台也可以支持外来数据,具体方法见https://clue.io/connectopedia/data_library_manifest
最后,使用过程中有疑问的话,可直接参考帮助网页:https://clue.io/connectopedia/
往期回顾
Connectivity Map(cMap)的探索应用(一)
Connectivity Map(cMap)的探索应用(二)
Connectivity Map(cMap)的探索应用(三)
今天的内容就到这里,更多内容可关注公共号“YJY技能修炼”~~~