专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
相关文章推荐
BioArt  ·  Mol Cell | HOXDeRNA ... ·  2 天前  
生物探索  ·  Nature Methods | ... ·  5 天前  
生物探索  ·  Protein & ... ·  5 天前  
今天看啥  ›  专栏  ›  生信宝典

Nature Communications | 基于ESMFold预测结构的几何图学习以准确预测酶功能

生信宝典  · 公众号  · 生物  · 2024-10-29 21:00

主要观点总结

这篇文章介绍了一种基于几何图学习的酶功能预测模型GraphEC。该模型能够预测酶活性位点、EC编号以及最适pH值。通过使用ESMFold预测的蛋白质结构和预训练的蛋白质语言模型,GraphEC在预测酶活性位点的指导下进行EC编号预测。同时,结合同源性信息,采用标签扩散算法进一步提高预测准确性。

关键观点总结

关键观点1: 研究背景

酶在许多生物过程中起到关键作用,识别酶功能对于研究代谢和疾病至关重要。传统计算方法存在局限性,无法充分利用蛋白质结构中的信息。近期深度学习方法在酶功能注释中取得了成功,但仍存在只使用蛋白质序列而不结合蛋白质结构、不采用酶活性位点的关键信息等局限性。

关键观点2: 研究方法

研究收集了多个数据集,构建了新的训练集和测试集。模型采用几何图学习,结合ESMFold预测的蛋白质结构进行训练。通过预训练语言模型生成信息丰富的序列嵌入以增强节点特征。此外,研究还采用了标签扩散算法,利用同源性信息进一步增强预测。模型扩展到酶最适pH预测,以协助实验。

关键观点3: 模型架构与实验

模型包括特征层、几何图学习、标签扩散算法等部分。实验结果表明,GraphEC在预测活性位点、EC编号和最适pH值方面优于最先进的方法。通过五倍交叉验证,GraphEC-AS的AUC达到了0.9635,证明了模型的稳健性。

关键观点4: 总结

GraphEC是一种基于几何图学习的EC数预测器,能够通过预测的活性位点指导学习。它利用ESMFold预测的结构进行几何图学习,有效提取结构信息。结合同源性信息和标签扩散算法,提高了模型性能。该模型能够全面分析酶的EC数、活性位点和最适pH值。


文章预览

欢 迎 向 本 公 众 号 (AI in Graph)投 稿 文 献 解 读 类 原 创 文 章 , 投 稿 邮 箱 :380198025 @ q q . c o m , 请 将 稿 件 以 附 件 形 式 发 送 。 海 内 外 招 生 、 访 学 、 招 聘 等 稿 件 , 请 联 系 微 信 :xiongzhankun1997 。 编译  |  王永康 审 核   |   熊 展 坤 今天给大家分享近期发表在Nature Communications的一篇论文“Accurately predicting enzyme functions through geometric graph learning on ESMFold-predicted structures”。酶在许多生物过程中都至关重要,酶委员会(EC)编号是定义酶功能的常用方法。然而,目前的EC预测方法尚未充分认识到酶活性位点和结构特征的重要性。本研究提出了GraphEC,一个基于几何图学习的EC编号预测器。 研究使用ESMFold预测结构和预训练的蛋白质语言模型,来构建一个模型来预测酶活性位点,并利用该模型来预测EC编号。通过结合同源性信息,研究 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览