医学博士,R语言及Python爱好者,科研方向为真实世界研究,生信分析与人工智能研究。
今天看啥  ›  专栏  ›  灵活胖子的科研进步之路

从GTEX官网下载表达谱数据并与表型文件整理合SummarizedExperiment格式

灵活胖子的科研进步之路  · 公众号  ·  · 2024-07-28 00:33

文章预览

前言 官网(可以按照组织类型下载) 下载了TPM与count格式,最后会统一合并进SE对象中 表型文件 数据下载官网地址:https://gtexportal.org/home/datasets 代码分享 library(SummarizedExperiment) library(tidyverse) library(TCGAbiolinks) library(openxlsx) library(data.table) library(IOBR) #读取表型数据 pdata "GTEx_Analysis_v8_Annotations_SubjectPhenotypesDS.txt") #读取count数据 c1 "gene_reads_2017-06-05_v8_colon_sigmoid.gct.gz") c2 "gene_reads_2017-06-05_v8_colon_transverse.gct.gz") c.all %select(-c(1:2)) #合并数据 #查看是否有重复值 isUnique(c.all $Description )%>%table() #去除重复 c.all"Description") #再次查看 isUnique(rownames(c.all))%>%table() #读取TPM数据 t1 "gene_tpm_2017-06-05_v8_colon_sigmoid.gct.gz") t2 "gene_tpm_2017-06-05_v8_colon_transverse.gct.gz") t.all %select(-c(1:2)) #合并数据 #查看是否有重复值 isUnique(t.all $Description )%>%table() #去除重复 t.all"Description") #再次查看 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览