文章预览
DRUG AI 2024年8月27日,清华大学生命科学学院/北京生物结构前沿研究中心龚海鹏课题组在《Nature Communications》杂志发表了题为“An end-to-end framework for the prediction of protein structure and fitness from single sequence”的文章。该研究提出了单序列蛋白质结构预测模型SPIRED,在 CAMEO /CASP15 测试集上与 OmegaFold 精度相当,在 SCOPe结构分类数据库上的预测精度超过了ESMFold。并且,SPIRED的推理速度大约是它们的 5 倍,训练时间消耗仅为它们的十分之一。通过将SPIRED与图神经网络集成为一个端到端的网络框架SPIRED-Fitness,能够快速预测蛋白质适应度以及结构。在ProteinGym数据集的零样本(zero-shot)与有监督(supervised)测试方式上,SPIRED-Fitness的预测精度超过了绝大部分的单序列模型,接近最先进的基于MSA的模型。此外,以SPIRED-Fitness的参数为起点训练得到的SPIRED-Stab模型,在
………………………………