文章预览
导入模块 #| label: load-packages #| message: false library (tidyverse) library (ggsignif) library (ggforce) 处理数据 TCGA-LIHC 表达数据 使用 UCSC Xena 数据库中下载的 GDC TCGA 肝癌( LIHC )的表达数据及其对应的注释文件。 TCGA-LIHC.star_fpkm.tsv gencode.v36.annotation.gtf.gene.probemap 可以直接从链接中读取数据,最好还是将数据下载到本地再进行读取。例如 probemap < - read_delim( "data/gencode.v36.annotation.gtf.gene.probemap" , delim = "\t" , show_col_types = FALSE ) %>% tibble::column_to_rownames( "id" ) lihc < - read_tsv( "data/TCGA-LIHC.star_fpkm.tsv.gz" , show_col_types = FALSE ) %>% mutate(symbol = probemap[Ensembl_ID,]$gene) %>% dplyr::select(-Ensembl_ID) %>% group_by(symbol) %>% summarise_all(mean) %>% tibble::column_to_rownames( "symbol" ) 拆分原
………………………………