专栏名称: ScienceAI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。
目录
今天看啥  ›  专栏  ›  ScienceAI

模拟5亿年的进化信息,首个同时推理蛋白质序列、结构和功能的生物学大模型

ScienceAI  · 公众号  ·  · 2024-06-26 12:01

文章预览

将 ScienceAI   设为 星标 第一时间掌握 新鲜的 AI for Science 资讯 编辑 | 萝卜皮 在三十亿年的自然进化历程中,现存蛋白质的形态得以形成,经历了漫长的自然筛选过程。进化如同在地质时间尺度上进行的平行实验,通过随机突变和选择机制,依据蛋白质的序列、结构与功能进行筛选。 在这里,EvolutionaryScale 的研究人员展示了在进化产生的标记上训练的语言模型可以充当进化模拟器,用于生成不同于已知蛋白质序列的功能性蛋白质。 研究人员提出了 ESM3,这是 一种前沿的多模态生成语言模型,可推理蛋白质的序列、结构和功能 。ESM3 可以结合其模态来遵循复杂的提示,并且对生物学对齐(biological alignment)高度敏感。 研究人员使用 ESM3 生成荧光蛋白。其中一种功能上明亮的荧光蛋白,与已知的荧光蛋白的序列差异很大(58% 同源性)。 该研究的预印 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览