专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
今天看啥  ›  专栏  ›  生信菜鸟团

DNA语言基础模型,从DNA序列中准确预测分子表型 | Nat.Methods

生信菜鸟团  · 公众号  · 生物  · 2025-02-20 10:30
    

文章预览

Basic Information 英文标题:Nucleotide Transformer: building and evaluating robust foundation models for human genomics 中文标题:核苷酸 Transformer:构建和评估用于人类基因组学的稳健基础模型 发表日期:28 November 2024 文章类型:Article 所属期刊:Nature Methods 文章作者:Hugo Dalla-Torre | Thomas Pierrot 文章链接:https://www.nature.com/articles/s41592-024-02523-z Abstract Para_01 从DNA序列预测分子表型仍然是基因组学中的一个长期挑战,通常由有限的注释数据和无法在任务之间转移学习所驱动。 在这里,我们对预训练在DNA序列上的基础模型进行了广泛的研究,这些模型被称为核苷酸转换器,参数范围从5000万到25亿,并整合了来自3,202个人类基因组和850个不同物种基因组的信息。 这些转换器模型生成了特定上下文的核苷酸序列表示,即使在数据量较少的情况下也能进行准确预测。 我们展示了开 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览