今天看啥  ›  专栏  ›  大数据文摘

1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模

大数据文摘  · 公众号  · 大数据  · 2024-06-27 20:40
大数据文摘授权转载自HyperAI超神经作者:梅菜编辑:李宝珠近年来,大规模预训练模型正在引领新一轮人工智能浪潮。「大模型」通过从大规模、多来源的数据中提取深层次规律,进而能够作为「基础模型」服务不同领域的多样化任务。例如,大语言模型通过学习大量文本数据,掌握了理解和识别语言的能力,革新了自然语言处理领域的范式。同理,在生命科学领域,生物体也有其「底层语言」——细胞是人体的基本结构和功能单位,如果将 DAN、RNA、蛋白质和基因表达值比作「词语」,其组合在一起就连成了「细胞」这个句子。所以,如果能够基于细胞「语言」开发人工智能细胞大模型,将有望为生命科学和医学提供全新的研究范式和革命性的研究工具。然而,当前训练大规模单细胞数据主要存在以下三点挑战:* 基因表达预训练数据需要涵盖不 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照