专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
今天看啥  ›  专栏  ›  生信宝典

Nature Communications | 基于ESMFold预测结构的几何图学习以准确预测酶功...

生信宝典  · 公众号  · 生物  · 2024-10-29 21:00
    

主要观点总结

这篇文章介绍了一种基于几何图学习的酶功能预测模型GraphEC。该模型能够预测酶活性位点、EC编号以及最适pH值。通过使用ESMFold预测的蛋白质结构和预训练的蛋白质语言模型,GraphEC在预测酶活性位点的指导下进行EC编号预测。同时,结合同源性信息,采用标签扩散算法进一步提高预测准确性。

关键观点总结

关键观点1: 研究背景

酶在许多生物过程中起到关键作用,识别酶功能对于研究代谢和疾病至关重要。传统计算方法存在局限性,无法充分利用蛋白质结构中的信息。近期深度学习方法在酶功能注释中取得了成功,但仍存在只使用蛋白质序列而不结合蛋白质结构、不采用酶活性位点的关键信息等局限性。

关键观点2: 研究方法

研究收集了多个数据集,构建了新的训练集和测试集。模型采用几何图学习,结合ESMFold预测的蛋白质结构进行训练。通过预训练语言模型生成信息丰富的序列嵌入以增强节点特征。此外,研究还采用了标签扩散算法,利用同源性信息进一步增强预测。模型扩展到酶最适pH预测,以协助实验。

关键观点3: 模型架构与实验

模型包括特征层、几何图学习、标签扩散算法等部分。实验结果表明,GraphEC在预测活性位点、EC编号和最适pH值方面优于最先进的方法。通过五倍交叉验证,GraphEC-AS的AUC达到了0.9635,证明了模型的稳健性。

关键观点4: 总结

GraphEC是一种基于几何图学习的EC数预测器,能够通过预测的活性位点指导学习。它利用ESMFold预测的结构进行几何图学习,有效提取结构信息。结合同源性信息和标签扩散算法,提高了模型性能。该模型能够全面分析酶的EC数、活性位点和最适pH值。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照