注册登录

专栏名称: 生信技能树

生物信息学学习资料分析，常见数据格式及公共数据库资料分享。常见分析软件及流程，基因检测及癌症相关动态。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

深圳特区报 · 深圳这些新地标最新进展→ · 3 天前

深圳发布 · 超过1000座！ · 3 天前

深圳发布 · 深圳医保最新通知！网友大呼：太赞了！ · 3 天前

深圳宁南山 · 官网说电池只有2.25度电，但却可以负重40 ... · 3 天前

今天看啥 › 专栏 › 生信技能树

转录组测序后的表达量矩阵是否需要清理非编码基因呢

生信技能树 · 公众号 · · 2024-09-22 11:51

文章预览

在前面的笔记里面：有一些错误在图片上面显示不出来，我们提到了一个数据挖掘文章把tcga数据库的肝癌转录组测序数据集里面的差异分析弄反了，方法学描述是：using the package DEG- seq2, Adj. p value < 0.05 and |logFC| > 2 were regarded as the cut-off criteria. This identified 2162 genes met the standards 实际上我们很容易去复现，但是很难拿到同样的差异情况。首先看看表达量矩阵 # 魔幻操作，一键清空 rm(list = ls()) options(stringsAsFactors = F ) library (data.table) a1=fread( 'input/TCGA-LIHC.htseq_counts.tsv.gz' , data.table = F ) dim(a1) a1[ 1 : 4 , 1 : 4 ] a1[(nrow(a1)- 5 ):nrow(a1), 1 : 4 ] dim(a1) # all data is then log2(x+1) transformed. #length(unique(a1$AccID)) #length(unique(a1$GeneName)) mat= a1[, 2 :ncol(a1)] mat[ 1 : 4 , 1 : 4 ] mat=mat[ 1 :(nrow(a1)- 4 ),] mat=ceiling( 2 ^(mat)- 1 ) #log2(x+1) transformed. mat[ 1 : 4 , ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

深圳特区报 · 深圳这些新地标最新进展→

3 天前

深圳发布 · 超过1000座！

3 天前

深圳发布 · 深圳医保最新通知！网友大呼：太赞了！

3 天前

深圳宁南山 · 官网说电池只有2.25度电，但却可以负重40公斤理论最大续航50-20241224154933

3 天前

医学影像服务中心 · 今日征象 | 股骨凹陷征

5 月前

狐狸说安全 · One-Fox工具箱V8.1公开版补丁包已发布！

4 月前

亮见数字城市 · 6亿投资！8个智慧交通项目工程启动！

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号