专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
今天看啥  ›  专栏  ›  生信菜鸟团

转录组数据挖掘

生信菜鸟团  · 公众号  · 生物  · 2024-09-23 18:28
    

文章预览

学习笔记总结于『生信技能树』马拉松课程 本系列将学习转录组数据挖掘及代码,那么 转录组数据挖掘 是什么呢?与GEO芯片数据挖掘有什么区别呢? 转录组和芯片都是一种测定基因表达量的手段,但两者原理不同,分析方法也就不同。 下面介绍转录组对输入数据的要求 一、输入数据 1.表达矩阵 转录组的输入数据与芯片的不同,芯片的表达矩阵用光信号值来表示基因表达量,转录组的表达矩阵不是光信号值 ①矩阵要是数值型的,不能是字符型 ②转录组的数据有好几种类型,而我们需要的是count,要是整数(芯片的是小数),如果是其他类型的后续再说 ③行名最终要转成基因symbol(芯片也是这个要求) ④低表达量的基因要过滤掉(芯片不用,因为光信号之间相对而言不会有太小的值),转录组中有的基因会在大部分甚至所有样本中表达量都为0 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览