文章预览
上周(2024.8.3),首尔大学 Martin Steinegger 课题组发布了Foldseek系列的新工作——“折叠匠人” FoldMason 。 如题所示, FoldMason的功能是蛋白的大规模的多结构对齐/比对 (multiple structure alignment, MSTA ),而MSTA的难点恰在大规模。 简介这篇工作前,我们先梳理Foldseek系列工作的联系: Foldseek (2022.2), 化三维结构为一维序列,快速比对结构,从而快速搜索结构。 Foldcomp (2022.12),压缩三维结构,高效存储AFDB。 Foldseek-cluster (2023.3),利用foldseek对大量结构进行聚类,聚类分析整个AFDB。 Foldseek-multimer (2024.4),将foldseek延展到多体蛋白。 FoldMason (2024.8),多结构对齐,能分析由foldseek-cluster获得的AFDB聚类。 前三个工具,我们在去年的文章 《 蛋白结构生物信息学的造极:AlphaFold DB的结构挖掘 》 中较详细地介绍过。 我们可以看出,其中最关键的是三步
………………………………