文章预览
我们的马拉松授课第二单元是GEO数据库里面的表达量芯片数据处理,已经是非常稳定的流程了,可以应付绝大部分公司的绝大部分技术平台。 因为代码流程固定下来了,导致很多小伙伴在做练习题的时候,仅仅是机械式的修改里面的GSE的ID号码而已,并没有做更多的思考。 任意数据集只需要有分组,都可以很简单的差异分析,有差异结果里面的上下调基因就可以富集分析。但是,差异和富集是第一步而已! 比如这个2015的文献就被学员挑选到了:《The inflammatory cytokine TWEAK decreases PGC-1α expression and mitochondrial function in acute kidney injury》,它对应的数据集是:GSE273064,但是学员自己很难自己的独立判断自己的分析是否合理: 差异分析 我通常会让已经完成了差异分析和富集分析的学员们仔细地读一下文献,起码多复现一个图,比如下面的指定的通路以及
………………………………