文章预览
今天我们来介绍一款对蛋白序列进行快速功能注释的软件: eggNOG-mapper 。 过去想知道一条 未知 蛋白序列的功能,我们的做法通常是用 blast 或 interProScan 软件基于序列相似性找到其直系同源基因,但这种做法不太可靠,毕竟找到的基因可能是旁系同源基因。目前多个工具整体评估发现 eggNOG(evolutionary genealogy of genes: Non-supervised Orthologous Groups) 在区分直系同源基因与旁系同源基因上表现不错,因此 eggNOG-mapper 的作者基于 eggNOG 数据库开发了这款工具,用于对序列进行功能注释。 eggNOG-mapper 网址: eggnog-mapper.embl.de 一、eggNOG-mapper 流程介绍 整个流程可以用一句话来概括,选择 HMMER 或 DIAMOND 或 MMSEQS2 方法将输入的蛋白序列与 eggNOG 数据库进行比对 ,每条序列的最佳匹配结果以 seed ortholog 形式存放 ,基于 eggNOG 进化树数据库进一步筛选推断直系同源基因,
………………………………