举个栗子,GSE99410和GSE78200。
library(GEOquery)
gse = "GSE78200"
eSet <- getGEO(gse, destdir = '.',getGPL = F)
exp <- exprs(eSet[[1]])
#Error in exp[1:4, 1:4] : subscript out of bounds
exp[1:4,1:4]
boxplot(exp)
#Error in names(groups) <- nam : 'names' attribute [10] must be the same length as the vector [0]
代码看起来没有问题,怎么就画不了图?
dim(exp)
#[1] 0 10
因为它是空数据啊。
有两种情况
第一类,不是芯片数据,用于后续分析的文件以其他形式存储了,这是GSE99410的
这是GSE78200的:
第二类,就是作者没有并上传表达矩阵,而是只提供了原始数据文件,如CEL、txt、gpr等格式。
原始数据的处理,有法可依呀。
CEL格式的芯片原始数据处理方法
aglient 家txt格式的芯片原始数据处理方法
gpr格式的芯片原始数据处理方法
如果是illumina的bead芯片,可以用lumi试试,还没有整理。
处理原始数据的技能搞定,还有一个问题可以一并解决:
表达矩阵里有负值,无法正常用limma包做下游分析了,也可以找找原始数据去处理它 ~