主要观点总结
本文介绍了基于骨架结构的蛋白质序列设计的研究进展,特别是全新蛋白质序列设计的问题。文章重点关注了北京大学来鲁华/张长胜团队发展的全原子蛋白质序列设计的深度学习算法GeoSeqBuilder。该算法能够在序列设计中考虑蛋白质侧链的原子细节信息,生成高精度的侧链构象,并成功应用于天然蛋白质结构、全新设计结构和酶的序列设计。文章还介绍了GeoSeqBuilder的模型框架、结果以及应用实例。
关键观点总结
关键观点1: 研究背景
蛋白质序列设计是全新蛋白质设计的关键问题之一,近年来随着深度学习方法和技术的发展,该问题取得了重要进展。
关键观点2: 代表性工作
ProteinMPNN、ABACUS-R、ProDesign-LE等工作在序列设计中取得重要进展,但存在未考虑蛋白质侧链的原子细节信息的不足。
关键观点3: GeoSeqBuilder的特点
GeoSeqBuilder是首个全原子蛋白质序列设计的深度学习算法,能够生成高精度的侧链构象,更直接地给出原子之间的相互作用,不需要进行单序列结构预测。
关键观点4: GeoSeqBuilder的应用
GeoSeqBuilder在天然蛋白质结构、全新设计结构和酶的序列设计的实验测试中获得了高成功率,解析的晶体结构与设计结构模型在原子尺度细节上高度吻合。
关键观点5: 模型框架及结果
GeoSeqBuilder主要包含三部分:多尺度图卷积网络、三角网络、迭代模块。该模型在CATH4.3数据集上进行了训练和验证,序列恢复率达到了52%。
关键观点6: 实验结果
GeoSeqBuilder成功设计了多个蛋白质的序列,这些序列能够在实验条件下表达并具有与计算设计的结构模型高度一致的结构特征。
文章预览
# Vol.1/ 研究背景 随着基于骨架结构的蛋白质序列设计是全新蛋白质设计的关键问题之一。近年来,随着深度学习方法和技术的发展,全新蛋白质序列设计取得了重要进展。其中代表性的工作包括ProteinMPNN,ABACUS-R,ProDesign-LE等,都在序列设计中取得了重要进展,并进行了相应的实验验证。然而,这些代表性的方法在模型训练和结果输出中均没有直接考虑蛋白质侧链的原子细节信息。一方面,蛋白质侧链构象对蛋白质执行功能具有重要作用。另一方面,大量的序列设计算法依赖结构预测来评估设计序列的可靠性,而单序列结构预测依旧是一个非常大的挑战。近期,北京大学来鲁华/张长胜团队发展了全原子蛋白质序列设计的深度学习算法GeoSeqBuilder,这一成果近期发表于Angewandte Chemie1,文章初稿2024年3月以预印本形式发表2。GeoSeqBuilder在生成序列的同
………………………………