专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
BioArt  ·  Immunity | ... ·  2 天前  
BioArt  ·  Science ... ·  3 天前  
今天看啥  ›  专栏  ›  生信菜鸟团

最新版:TCGA 三阴性乳腺癌基因表达数据下载及生存分析

生信菜鸟团  · 公众号  · 生物  · 2025-03-26 12:30
    

文章预览

之前发了这篇推文后,有老师帮忙提出几条意见【非常感谢这位老师 ❤ 】,确实是之前考虑不到位的地方,查阅TCGAbiolinks的文档以后,进行了重新的整理,供大家参考~ 您没有去除数据中的癌旁组织和正常组织样本; 不应该使用基因表达counts数据或log(counts)数据,而应该提取其中的TPM或FPKM表达量,否则会造成样本之间的表达量不可比 新版TCGAbiolinks下载的数据集自带gene name,无需手动转换 根据老师的建议,我在这次的代码中进行了以下改变: 先去除正常组织,然后在肿瘤组织中进一步筛选TNBC的样本 提取了tpm_unstrand数据 用rowData函数直接提取基因名,省掉很多麻烦 需要清楚的是,TCGA中不同的组织来源: 其中,01一直到14的编号是隐藏在patient id或者barcode中的。 也就是说,BRCA数据集组织分别来自于正常组织,原发组织和转移组织。 rm(list = ls()) librar ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览