专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
今天看啥  ›  专栏  ›  生信技能树

不要简单的相信作者提供的表达量矩阵

生信技能树  · 公众号  ·  · 2024-11-14 18:19

文章预览

GEO(Gene Expression Omnibus)数据库是一个公共的基因表达量数据库,它收录了来自不同平台的高通量基因表达数据,包括Affymetrix、Illumina和Agilent等。每个平台都有自己的文件格式和数据处理流程,以下是对这三个主要平台的简要介绍: Affymetrix : 平台特点 :Affymetrix平台使用微阵列技术,每个探针对应一个特定的基因或转录本。 文件格式 :Affymetrix数据通常以 .CEL 文件格式存储,这是一种二进制格式,包含了原始的荧光强度值。 数据处理 :需要使用专门的软件(如Affymetrix Power Tools, dChip, or R/Bioconductor的 affy 包)来读取 .CEL 文件,并进行标准化和背景校正。 Illumina : 平台特点 :Illumina平台使用测序技术,可以提供单核苷酸多态性(SNP)和基因表达数据。 文件格式 :Illumina数据以 .idat 文件格式存储,这是原始的图像强度数据。 数据处理 :需要使用Il ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览