注册登录

专栏名称: 小明的数据分析笔记本

分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子；偶尔会分享一些组学数据处理相关的内容

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

新疆949交通广播 · 投运倒计时！乌鲁木齐国际机场传来好消息 · 5 小时前

新疆是个好地方 · 降雪，临时闭园！ · 5 小时前

新疆是个好地方 · 降雪，临时闭园！ · 5 小时前

新疆949交通广播 · 6月26日至30日举办！就在乌鲁木齐！ · 昨天

新疆949交通广播 · 134人！公开招聘事业单位工作人员 · 2 天前

今天看啥 › 专栏 › 小明的数据分析笔记本

大豆Cell论文中泛基因家族分析复现七：不同类别基因dN/dS值箱线图

小明的数据分析笔记本 · 公众号 · · 2024-11-25 21:36

文章预览

大豆的数据来源论文 https://www.sciencedirect.com/science/article/pii/S0092867420306188 Pan-Genome of Wild and Cultivated Soybeans 大豆基因组数据下载链接 https://ngdc.cncb.ac.cn/soyomics/download 下载基因组fasta和对应的蛋白注释文件，用gffread提取cds序列和蛋白序列把所有样本的cds合并到一起 cat *.CDS.fasta > all.samples.cds 计算dN/dS值的和核苷酸多样性整体的计算量还是挺大的，我这里每个类别的基因家族随便选择几个 dat.family.group %>% filter(group=="Core") %>% sample_n(10) %>% pull(familyID) %>% write_lines("cell.soybean.PanGenome/core_family.txt") python get_wgd_input.py core_family.txt ../06.longestTranscriptProt/OrthoFinder/Results_Jul27/Orthogroups/Orthogroups.txt core_wgd.input core.gene.ids python脚本把Orthofinder的结果整理成wgd这个软件的输入格式，同时生成一个所有基因的id，把这些基因先从所有cds里提取出来 python脚本第一个位置 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新疆949交通广播 · 投运倒计时！乌鲁木齐国际机场传来好消息

5 小时前

新疆是个好地方 · 降雪，临时闭园！

5 小时前

新疆是个好地方 · 降雪，临时闭园！

5 小时前

新疆949交通广播 · 6月26日至30日举办！就在乌鲁木齐！

昨天

新疆949交通广播 · 134人！公开招聘事业单位工作人员

2 天前

中国科学报 · 受挫！美迄今最大规模暗物质搜索一无所获

6 月前

中国电科 · 制胜！中国电科第十五届珠海航展国风主题片发布

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号