文章预览
Abstract 摘 要 近日,扬州大学农学院 张韬 教授课题组在 Molecular Plant 在线发表了题为 PDLLMs: A group of tailored DNA large language models for analyzing plant genomes 的研究论文,开发了一系列基于植物基因组的基础 DNA 大语言模型,该研究构建的 130M 大小的 plant DNAMamba 模型仅以 十分之一的参数量就打败了 由 InstaDeep 、 Google DeepMind 顶尖机构联合开发的同类模型 AgroNT 。模型的开发 填补了植物基因组研究中缺乏适宜本地化运行的 基础 DNA 大语言模型的空白。 https://doi.org/10.1016/j.molp.2024.12.006 研究背景 Background 大语言模型( Large language models , LLMs )是一类利用大规模数据进行预训练的语言模型,在过去的几年间, LLMs 已在生成式人工智能领域得到了广泛的应用,如 ChatGPT 、 Stable Diffusion 等。传统大语言模型最初被设计用于处理人类语言,近年来也逐渐被应用于 DNA
………………………………