专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
今天看啥  ›  专栏  ›  生信宝典

Mol Plant | 基于植物基因组的DNA大语言模型

生信宝典  · 公众号  · 生物  · 2025-01-03 21:00
    

文章预览

Abstract  摘 要 近日,扬州大学农学院 张韬 教授课题组在 Molecular Plant 在线发表了题为 PDLLMs: A group of tailored DNA large language models for analyzing plant genomes 的研究论文,开发了一系列基于植物基因组的基础 DNA 大语言模型,该研究构建的 130M 大小的 plant DNAMamba 模型仅以 十分之一的参数量就打败了 由 InstaDeep 、 Google DeepMind 顶尖机构联合开发的同类模型 AgroNT 。模型的开发 填补了植物基因组研究中缺乏适宜本地化运行的 基础 DNA 大语言模型的空白。 https://doi.org/10.1016/j.molp.2024.12.006 研究背景  Background 大语言模型( Large language models , LLMs )是一类利用大规模数据进行预训练的语言模型,在过去的几年间, LLMs 已在生成式人工智能领域得到了广泛的应用,如 ChatGPT 、 Stable Diffusion 等。传统大语言模型最初被设计用于处理人类语言,近年来也逐渐被应用于 DNA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览