大豆Cell论文中泛基因家族分析复现三：核心和泛基因家族曲线

小明的数据分析笔记本 · 公众号 · · 2024-11-17 19:58

文章预览

大豆的数据来源论文 https://www.sciencedirect.com/science/article/pii/S0092867420306188 Pan-Genome of Wild and Cultivated Soybeans 大豆基因组数据下载链接 https://ngdc.cncb.ac.cn/soyomics/download 下载基因组fasta和对应的蛋白注释文件，用gffread提取cds序列和蛋白序列前一篇推文已经运行了orthofinder，拿到了Orthogroups.GeneCount.tsv文件，利用这个文件转换得到PanGP这个软件的输入数据，然后用PanGP得到画图数据文件格式转换代码 library(tidyverse) read_tsv("cell.soybean.PanGenome/Orthogroups.GeneCount.tsv") %>% dplyr::select(-Total) %>% column_to_rownames("Orthogroup") %>% mutate(across(everything(),~ifelse(.>0,1,0))) %>% write_delim(file = "cell.soybean.PanGenome/cell.soybean.PanGP.input", delim = "", col_names = FALSE) PanGP输入数据的部分截图每行是一个基因家族，每列是一个样本，1代表这个样本里有这个基因家族，0代 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

一条 · 意大利黄鳍金枪鱼罐头，肉嫩细滑，低脂味美，健康轻食好搭档！

昨天

新重庆-重庆日报 · 创意视频｜新春第一会绘出新重庆新篇章

昨天

新重庆-重庆日报 · 创意视频｜新春第一会绘出新重庆新篇章

昨天

一条 · 舒适时髦的秋冬打底衣裤，性价比高，不挑身材，能穿到160斤！

4 天前

一条 · 宜庭90%白鹅绒丝被，加厚填充，磨绒被套，新款印花，亲肤柔暖

4 天前

镭射财经 · “学历贷”再度火爆，消费金融公司纷纷布局

8 月前

荣茂观察 · 一场新的财富变革开始了！如何守住你的财富？

5 月前