专栏名称: ScienceAI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。
今天看啥  ›  专栏  ›  ScienceAI

Nature子刊,香港浸大、英伟达团队多模态深度语言模型,用于复杂的宏基因组研究

ScienceAI  · 公众号  ·  · 2024-10-15 11:53

文章预览

将 ScienceAI   设为 星标 第一时间掌握 新鲜的 AI for Science 资讯 编辑 | 萝卜皮 宏基因组组装基因组 (MAG) 为利用宏基因组测序数据探索微生物「暗物质」提供了宝贵的见解。 然而,人们越来越担心 MAG 中的污染可能会严重影响下游分析的结果。目前的 MAG 净化工具主要依赖于标记基因,并没有充分利用基因组序列的背景信息。 为了克服这一限制,香港浸会大学(Hong Kong Baptist University)和英伟达 AI 技术中心(NVIDIA AI Technology Center)的研究人员提出了 Deepurify 来进行 MAG 净化。 Deepurify 使用多模态深度语言模型和对比学习来匹配微生物基因组序列与其分类谱系。它将 MAG 内的 contig 分配给 MAG 分离树,并应用树遍历算法将 MAG 划分为子 MAG,目的是最大化高质量和中质量子 MAG 的数量。 Deepurify 在模拟数据、CAMI 数据集和复杂程度各异的真实数据集上的表现均 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览