专栏名称: 生信石头
记录和分享生信学习经验和数据处理技巧
目录
相关文章推荐
今天看啥  ›  专栏  ›  生信石头

150亿参数的蛋白质语言模型ESMFold测试报告出炉!

生信石头  · 公众号  ·  · 2024-07-24 10:30

文章预览

今天,我们的主角是ESMFold。 ESMFold是一个基于Transformer150亿参数的语言模型,也是迄今为止规模最大的蛋白质语言模型,它可以学习输入序列中成对氨基酸之间的相互作用模式,实现从蛋白质个体的序列,直接进行高准确度、端对端、原子层级的结构预测。 为了将ESMFold模型应用于蛋白质结构预测,科晶生物研究团队为模型输入了已知晶体结构的蛋白质序列,来评估蛋白质三维结构方面的准确性。我们来看看完整的实验: 一、测试目的 评估ESMFold模型在预测蛋白质三维结构方面的准确性,并验证其与UniProt数据库中已知晶体结构的蛋白质进行比对的效果。 二、数据来源 采用UniProt数据库中已知晶体结构的蛋白质进行测试。 三、测试方法 01.模型预测: 使用ESMFold模型对目标蛋白质进行结构预测。 02.结构比对: 将预测结构与UniProt中已知的晶体结构进行 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览