主要观点总结
这篇文章介绍了一种基于几何图学习的酶功能预测模型GraphEC。该模型能够预测酶活性位点、EC编号以及最适pH值。通过使用ESMFold预测的蛋白质结构和预训练的蛋白质语言模型,GraphEC在预测酶活性位点的指导下进行EC编号预测。同时,结合同源性信息,采用标签扩散算法进一步提高预测准确性。
关键观点总结
关键观点1: 研究背景
酶在许多生物过程中起到关键作用,识别酶功能对于研究代谢和疾病至关重要。传统计算方法存在局限性,无法充分利用蛋白质结构中的信息。近期深度学习方法在酶功能注释中取得了成功,但仍存在只使用蛋白质序列而不结合蛋白质结构、不采用酶活性位点的关键信息等局限性。
关键观点2: 研究方法
研究收集了多个数据集,构建了新的训练集和测试集。模型采用几何图学习,结合ESMFold预测的蛋白质结构进行训练。通过预训练语言模型生成信息丰富的序列嵌入以增强节点特征。此外,研究还采用了标签扩散算法,利用同源性信息进一步增强预测。模型扩展到酶最适pH预测,以协助实验。
关键观点3: 模型架构与实验
模型包括特征层、几何图学习、标签扩散算法等部分。实验结果表明,GraphEC在预测活性位点、EC编号和最适pH值方面优于最先进的方法。通过五倍交叉验证,GraphEC-AS的AUC达到了0.9635,证明了模型的稳健性。
关键观点4: 总结
GraphEC是一种基于几何图学习的EC数预测器,能够通过预测的活性位点指导学习。它利用ESMFold预测的结构进行几何图学习,有效提取结构信息。结合同源性信息和标签扩散算法,提高了模型性能。该模型能够全面分析酶的EC数、活性位点和最适pH值。
文章预览
欢 迎 向 本 公 众 号 (AI in Graph)投 稿 文 献 解 读 类 原 创 文 章 , 投 稿 邮 箱 :380198025 @ q q . c o m , 请 将 稿 件 以 附 件 形 式 发 送 。 海 内 外 招 生 、 访 学 、 招 聘 等 稿 件 , 请 联 系 微 信 :xiongzhankun1997 。 编译 | 王永康 审 核 | 熊 展 坤 今天给大家分享近期发表在Nature Communications的一篇论文“Accurately predicting enzyme functions
through geometric graph learning on ESMFold-predicted structures”。酶在许多生物过程中都至关重要,酶委员会(EC)编号是定义酶功能的常用方法。然而,目前的EC预测方法尚未充分认识到酶活性位点和结构特征的重要性。本研究提出了GraphEC,一个基于几何图学习的EC编号预测器。 研究使用ESMFold预测结构和预训练的蛋白质语言模型,来构建一个模型来预测酶活性位点,并利用该模型来预测EC编号。通过结合同源性信息,研究
………………………………