连接人工智能技术人才和产业人才的交流平台
目录
相关文章推荐
Web3天空之城  ·  Sam Altman ... ·  昨天  
Web3天空之城  ·  Sam Altman ... ·  昨天  
新智元  ·  永别了,GPT-4! ·  2 天前  
宝玉xp  ·  转发微博-20250412002047 ·  3 天前  
今天看啥  ›  专栏  ›  机器学习研究组订阅

Transformer大杀器进入蛋白质组学,一文梳理LLM如何助力生命科学领域大变革

机器学习研究组订阅  · 公众号  · AI  · 2024-05-26 16:32
    

文章预览

「大语言模型」不仅可以用于人类语言,也可以用于蛋白质的「语言」,而且两者之间有很多相似之处。 过去几年,Transformer架构带来了大模型在文本和图像方面的惊人进展,当应用于生命科学领域时,也取得了影响深远的的成果。 大语言模型是如何应用于蛋白质组学的?科学家们又有哪些发现? 蛋白质是一种「语言」 自然语言由单词、短语、句子等不同层次的模块组成,蛋白质的「语言」也是类似的情况。 蛋白质由基序(motif)和结构域(domain)组成,类似于蛋白质世界的「单词」和「短语」。 基序和结构域的各种组合与重复构建了更加复杂的结构,从而决定蛋白质的生物功能,类似于人类语言中句子传达的含义。 除了结构层次的相似性,蛋白质和人类语言还有另一个关键的相似点——「信息完整性」。 这意味着从信息论的角度来看,蛋白 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览