文章预览
逆向折叠模型指的是通过已知的蛋白质三维结构推导出氨基酸序列,在基于结构的设计中起着重要作用。如逆向折叠模型 ProteinMPNN 已被训练用来可靠地从已知结构中生成序列。 然而,由于这些模型主要从较长蛋白质衍生的数据上进行训练,导致其在肽设计任务中表现不佳,倾向于生成重复的序列,缺乏多样性,且不能正确折叠成目标结构的序列。 为了解决这一问题,来自 斯坦福大学、英伟达、Flagship Pioneering、以色列理工学院,以及牛津大学的研究人员通过直接偏好优化 (DPO)微调ProteinMPNN模型 ,以产生多样且结构一致的肽序列 。相关文章以“ Improving Inverse Folding For Peptide Design With Diversity-Regularized Direct Preference Optimization ”为题发表在预印本平台 arXiv 上。 多肽是由 2-50 个残基组成的小型聚合物,作为激素、神经递质、信号分子等参与人体各种
………………………………