文章预览
前言 tidybulk整体介绍 教程网址:https://stemangiola.github.io/tidybulk/ 整体图标 代码(示例数据) library(tidyverse) library(tidybulk) library(SummarizedExperiment) data(counts_SE) counts_SE class(counts_SE) counts_SE %>% get_bibliography() #查看参考文献 测试数据本质上还是SE对象 SE对象增加了tidy的组织结构 引用参考文献的功能比较好 # 合并重复的基因名称 rowData(counts_SE) $gene_name = rownames(counts_SE) dim(counts_SE) counts_SE.aggr = counts_SE %>% aggregate_duplicates(.transcript = gene_name) dim(counts_SE.aggr) 由于没有重复的基因名称,因此维度没有变化 #对于counts数据进行标准化(统一测序深度) counts_SE.norm = counts_SE.aggr %>% identify_abundant(factor_of_interest = condition) %>% #过滤地表达基因 scale_abundance() #标准化后的se对象增加了一个assay矩阵 assays(counts_SE.norm)%>%names() assay(counts_SE.norm, "count_scaled"
………………………………