专栏名称: 生信石头
记录和分享生信学习经验和数据处理技巧
今天看啥  ›  专栏  ›  生信石头

小工具 | 简单查看两基因组可比较的位点数值与比例

生信石头  · 公众号  ·  · 2024-06-09 11:37
    

文章预览

写在前面 早前不时与廖总聊到一些比较基因组方面的数据分析细节。廖总非常喜欢说“这两个物种基因组的相似度是多少?”正常情况下,我们都会认为,相似度或许就是 ANI 或者其他评估方法。评估两个基因组的相似度本身是比较tricky的,因为我们往往需要考虑很多细节,比如用 kmer 算?还是利用序列算?用可比对上的序列算?还是要考虑 gap 比如 indel 等等。 另外,如果一个基因组的某个区域有复制,更或者直接 WGD 全基因组复制了,那么这个又怎么计算?或者回到简单的情况,如有重叠的比对呢?这些细节有太多。 不过,经过与廖总的沟通讨论,最后确定下来其实他习惯性的说 相似度 或者 相似性,但实际上指代的是 基因组A的所有位点能被基因组B的任一位点覆盖的比例。 这个指标简单粗暴,逻辑上就是不考虑任何 Gap / Insertion Deletion 等等。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览