文章预览
今天,我们的主角是ESMFold。 ESMFold是一个基于Transformer150亿参数的语言模型,也是迄今为止规模最大的蛋白质语言模型,它可以学习输入序列中成对氨基酸之间的相互作用模式,实现从蛋白质个体的序列,直接进行高准确度、端对端、原子层级的结构预测。 为了将ESMFold模型应用于蛋白质结构预测,科晶生物研究团队为模型输入了已知晶体结构的蛋白质序列,来评估蛋白质三维结构方面的准确性。我们来看看完整的实验: 一、测试目的 评估ESMFold模型在预测蛋白质三维结构方面的准确性,并验证其与UniProt数据库中已知晶体结构的蛋白质进行比对的效果。 二、数据来源 采用UniProt数据库中已知晶体结构的蛋白质进行测试。 三、测试方法 01.模型预测: 使用ESMFold模型对目标蛋白质进行结构预测。 02.结构比对: 将预测结构与UniProt中已知的晶体结构进行
………………………………