专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
今天看啥  ›  专栏  ›  生信菜鸟团

Count数据转换为TPM数据方法整理-常规方法、DGEobj.utils和IOBR包

生信菜鸟团  · 公众号  · 生物  · 2024-10-07 08:22

文章预览

在正式分析之前,对于数据的处理是至关重要的,这种重要性是体现在很多方面,其中有一点是要求分析者采用正确的数据类型。 对于 芯片数据 ,原始数据 进行log2处理之后可以进行很多常见的分析 ,比如差异分析、热图、箱线图、PCA分析、生存分析、模型构建,聚类分析和相关性分析等。 对于 转录组数据 ,在上述的常见分析中 只有差异分析时需要采用count值 , 其他的分析 是需要 采用log2后的cpm,tpm,fpkm,rpkm数据 。 除了上述的常规分析,在 使用不同R包 进行 分析之前务必浏览一下输入数据的要求 。 那么芯片数据还好说,毕竟后续进行log2处理后就可以做很多分析。但是转录组数据的可选项就比较多了。 但目前常用的只有tpm和cpm count数据转换为cpm数据非常简单 # exprSet是count表达矩阵 # 一句代码搞定 exprSet = log2(edgeR::cpm(exprSet)+ 1 ) 比较难 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览