文章预览
将 ScienceAI 设为 星标 第一时间掌握 新鲜的 AI for Science 资讯 编辑 | 萝卜皮 蛋白质因其多样性和重要功能,在生物研究和医学领域占据核心地位,但人类对其理解仍不全面。深度学习在蛋白质序列表示方面的应用,对于预测蛋白质功能至关重要。 为了深化对蛋白质的理解,密苏里大学(University of Missouri)的研究人员提出了 Prot2Token, 一种创新的多任务框架,它将自回归语言模型与蛋白质语言模型(PLMs)相结合,针对蛋白质序列进行多种预测任务,如蛋白质级、残基级预测以及蛋白质-蛋白质相互作用预测。 该研究以「 Prot2Token: A multi-task framework for protein language processing using autoregressive language modeling 」为题,于 2024 年 6 月 3 日发布在 bioRxiv 预印平台。 Prot2Token 通过其独特的标记化方法,使得现有 PLMs 能应用于各种任务,并通过在解码器中加入提
………………………………