文章预览
DRUG AI 今天为大家介绍的是来自西湖大学李子青团队的一篇论文。蛋白质-蛋白质结合在多种基本生物过程中起着关键作用,因此预测氨基酸突变对蛋白质-蛋白质结合的影响至关重要。为了应对注释突变数据稀缺的问题,利用大量未标注数据进行预训练已经成为一种有前景的解决方案。然而,这一过程面临一系列挑战:(1) 尚未完全捕捉到多个(不止两种)结构尺度之间复杂的高阶依赖关系;(2) 很少研究突变如何改变周围微环境的局部构象;(3) 预训练在数据规模和计算负担方面成本高昂。在本文中,作者首先构建了一个分层提示代码簿(hierarchical prompt codebook),独立记录不同结构尺度下常见的微环境模式。然后,作者开发了一种新颖的代码簿预训练任务,即掩码微环境建模(masked microenviroment modeling),用于模拟每个突变与其残基类型、角度统计和
………………………………