专栏名称: AI4Protein
读书破万卷juǎn,专注于AI蛋白相关的学术搬运。
今天看啥  ›  专栏  ›  AI4Protein

Science|基因语言模型Evo

AI4Protein  · 公众号  ·  · 2024-11-17 11:05

文章预览

Evo|基因语言模型 24年11月15日基因组语言模型 Evo 模型登上了 Science 封面文章。我立马跑去下载学习,眼前一亮的通讯作者 Brian L. Hie,名副其实的后浪 。因为 Brian 参与了 ESM 系列工作,也发表了蛋白语言模型进行抗体亲和力成熟的 Science 和 Nature Biotechnology 文章,所以他对语言模型的理解肯定是出类拔萃的。下面跟随笔者一起看看这篇文章。 正文 Evo 是24年11月15日在 Science 见刊的封面文章 [ 1 ],阅读了 《基因组语言模型的学习笔记》 就对GLM有了初步认识。下面进一步介绍 Evo 这一篇文章: 2.1 . 为什么不选择 Transformer,选择StripedHyena? 基因组的 数据长度太长 ,平均在3mb, 下图D ,Transformer学不好这么长的依赖关系 基因组数据 有许多的不同门(phylum)和纲(class) ,例如 Bacteroidota 是拟杆菌门, 下图E 性能更优 :在比较不同的模型架构时, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览