文章预览
看到了交流群小伙伴分享了一系列数据挖掘文章,都是浙江大学李兰娟院士的学生的成果。其中一个《 Characteristic Analysis of Featured Genes Associated with Cholangiocarcinoma Progression 》倒是蛮简单的,挑选TCGA数据库里面的 [GDC TCGA Bile Duct Cancer (CHOL)](https://xenabrowser.net/datapages/?cohort=GDC TCGA Bile Duct Cancer (CHOL) =https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443) 数据集,然后根据里面的样品的二分类属性(肿瘤样品和正常组织对照)做一个简单的差异分析,然后基于差异分析后的基因列表进行go和kegg的数据库注释,以及使用WGCNA算法构建网络,然后挑选合适的网络看里面的hub基因而已。 使用WGCNA算法构建网络 我们分两步走,完成这个数据挖掘的复现。 首先是差异分析 挑选TCGA数据库里面的 [GDC TCGA Bile Duct Cancer (CHOL)](https://xenabrowser.net/datapages/?cohort=GDC TCGA Bile Duct Cancer (CHOL) =https%3A%2
………………………………