专栏名称: CNS导读
关注有广泛深远影响的顶刊工作 Rigorous \x26amp; Elegant Science for Everyone
今天看啥  ›  专栏  ›  CNS导读

Science | 蛋白结构域百科全书

CNS导读  · 公众号  ·  · 2024-11-02 23:59

主要观点总结

伦敦大学学院的研究人员通过基于结构的策略对AlphaFold Protein Structure Database中的蛋白结构域进行了系统重挖掘和分类。这项工作相对于基于序列的方法提升了远源结构域和全新结构域的解析能力,并发现了新的对称和非对称折叠/结构域类型以及结构域超家族之间的互作。所构建的数据库被称为The Encyclopedia of Domains (TED),有助于人们更好地理解结构域的结构、功能及演化。该研究已在Science杂志发表,但尚需通过实验验证新发现结构域的比例和准确性。

关键观点总结

关键观点1: 基于结构的策略对蛋白结构域进行重挖掘和分类

研究人员使用了一种基于结构的策略来系统地重新挖掘和分类AlphaFold Protein Structure Database中的超过2.14亿个蛋白结构域。这种方法相对于基于序列的方法有所提升,特别是在解析远源结构域和全新结构域方面。

关键观点2: 发现了新的折叠/结构域类型和结构域超家族之间的互作

通过基于结构的系统重挖掘和分类,研究人员发现了上千种新的对称和非对称的折叠/结构域类型,以及上万种结构域超家族之间的互作。这为理解蛋白质的结构和功能提供了新的见解。

关键观点3: 构建了结构域百科全书(TED)

研究人员基于该方法构建了结构域百科全书(TED),旨在帮助人们增进对结构域的结构、功能以及演化的理解。这是一个重要的里程碑,为后续的研究提供了丰富的资源。

关键观点4: 工作已在Science杂志发表,但存在待验证的问题

该研究成果已在Science杂志上发表。然而,研究中的一个关键问题是需要实验验证新发现的结构域的比例和准确性,这是未来研究的重要方向。


文章预览

伦敦大学学院 (University College London) David T. Jones以及Christine A. Orengo等研究人员通过基于结构的策略对AlphaFold Protein Structure Database (AFDB) 数据集[1]中超2.14亿种蛋白的结构域进行了系统的重挖掘和分类;相对基于序列的方法[2], [3]提升了对远源结构域以及全新结构域的解析能力,新发现上千种对称以及非对称的折叠/结构域类型,以及上万种结构域超家族之间的互作[4], [5]。 基于该方法构建的数据库,研究人员称之为The Encyclopedia of Domains (TED,结构域百科全书) ,将帮助 人们 增进对结构域结构、功能以及演化的理解[4]。 基于结构的方法系统重挖掘和分类AFDB中的蛋白结构域,并解析新型折叠/结构域[4]。 该项工作2024年11月1日发表在Science[4]。 Comment(s): 其中一个关键是不知道新发现的结构域有多大比例是预测错误造成的,后续需要分层(长度、新颖程度 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览