文章预览
我们的马拉松授课最重要的技能就是表达量数据处理,包括表达量芯片,转录组测序,以及单细胞转录组的数据分析。 然后有小伙伴在实战到时候处理了他自己的一个简单的转录组测序,就是2分组,每个组是3个样品。然后使用我们的授课代码出图发现了一个他自己的知识点盲区: 知识点盲区 我们这个代码使用了十几年了,一直没有问题, 我随手处理了一个表达量芯片数据集:5 healthy tissue samples, 9 DCIS and 5 invasive ductal carcinomas were analysed. https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE21422 可以看到, 其中control样品,就是 5 healthy tissue samples,在层次聚类热图里面确实是5个样品,在pca图里面也是5个小点,然后有一个大的点。 所以看起来给初学者的感觉是多了一个样品,因为默认样品才是有点作为标记。 在pca图里面也是5个小点 实际上,这个是画主成分
………………………………