专栏名称: 生信宝典

生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程；高通量测序数据分析学习教程；生信软件安装教程。所有内容均为原创分享，致力于从基础学习到提高整个过程。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Mol Plant | 基于植物基因组的DNA大语言模型

生信宝典 · 公众号 · 生物 · 2025-01-03 21:00

文章预览

Abstract 摘要近日，扬州大学农学院张韬教授课题组在 Molecular Plant 在线发表了题为 PDLLMs: A group of tailored DNA large language models for analyzing plant genomes 的研究论文，开发了一系列基于植物基因组的基础 DNA 大语言模型，该研究构建的 130M 大小的 plant DNAMamba 模型仅以十分之一的参数量就打败了由 InstaDeep 、 Google DeepMind 顶尖机构联合开发的同类模型 AgroNT 。模型的开发填补了植物基因组研究中缺乏适宜本地化运行的基础 DNA 大语言模型的空白。 https://doi.org/10.1016/j.molp.2024.12.006 研究背景 Background 大语言模型（ Large language models ， LLMs ）是一类利用大规模数据进行预训练的语言模型，在过去的几年间， LLMs 已在生成式人工智能领域得到了广泛的应用，如 ChatGPT 、 Stable Diffusion 等。传统大语言模型最初被设计用于处理人类语言，近年来也逐渐被应用于 DNA ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博