文章预览
书接上回,上一个被老板火眼金睛挑出来的数据集,详见:《 2万个基因少一半也不影响最后的差异分析富集结果啊? 》 这次来看看 数据集: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE161533 ,共有84个 ESCC 样本: 吭哧吭哧一顿做完后,老板一看结果, 有一半的case混入control,这肯定不对。 老板解释道:癌症样本与癌旁样本肯定是可以分开的,你再回去看看。 前面的分析结果如下: 回去后我就自己看了下我的分组, 原来是因为样本中有三种组织类型,我只是将样本分成了两个组别:Normal一组,剩余的都是肿瘤组 : gse_number "GSE161533" dir.create(gse_number) setwd(gse_number) getwd() list.files() #gset gset '.' , getGPL = T) gset[[1]] a ## 挑选一些感兴趣的临床表型。 pd colnames(pd) pd $title pd $characteristics_ch1 table(pd $characteristics_ch1 ) ## ~~~分组信息编号需修改~~
………………………………