文章预览
在蛋白质工程和设计中,准确预测蛋白质突变效应,具有重要意义。 今日,清华大学生命科学学院Yunxin Xu, Di Liu & 龚海鹏Haipeng Gong,在Nature Computational Science上发文,提出了GeoStab-suite,基于几何学习的三大模型——GeoFitness, GeoDDG和GeoDTm——分别用于预测突变后蛋白质的适合度得分、ΔΔG和ΔTm。 GeoFitness采用专门的损失函数,利用深度突变扫描数据库中的大量多标记适应度数据,监督训练了统一模型。为了进一步改进ΔΔG和ΔTM预测的下游任务,在GeoDDG和 GeoDTm中,重新利用GeoFitness编码器作为预训练模块,以克服缺少足够标记数据的挑战。 这种预训练策略与数据扩展相结合,显著提高了模型的性能和可推广性。在基准测试中,就Spearman相关系数而言,GeoDDG和GeoDTm分别比其他最先进方法高出至少30%和70%。 Improving the prediction of protein stability changes upon mutation
………………………………