专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模

数据派THU  · 公众号  · 大数据  · 2024-07-05 17:00

文章预览

本文 约4800字 ,建议阅读 9 分钟 清华大学自动化系生命基础模型实验室和电子系/AIR 合作开展研究,构建了拥有 1 亿参数的 scFoundation 细胞大模型。 近年来,大规模预训练模型正在引领新一轮人工智能浪潮。「大模型」通过从大规模、多来源的数据中提取深层次规律,进而能够作为「基础模型」服务不同领域的多样化任务。例如,大语言模型通过学习大量文本数据,掌握了理解和识别语言的能力,革新了自然语言处理领域的范式。 同理,在生命科学领域,生物体也有其「底层语言」——细胞是人体的基本结构和功能单位, 如果将 DAN、RNA、蛋白质和基因表达值比作「词语」,其组合在一起就连成了「细胞」这个句子。 所以,如果能够基于细胞「语言」开发人工智能细胞大模型,将有望为生命科学和医学提供全新的研究范式和革命性的研究工具。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览