文章预览
作者:周冰心,十九 编辑:李宝珠 上海交通大学洪亮团队设计了一种扩散概率模型框架 CPDiffusion,该框架能够以非常低的训练成本、数据成本学习蛋白质的序列、结构与功能之间的隐含映射关系,从而生成多样化的蛋白质序列。 蛋白质是生命活动的主要执行者,其结构与功能之间的关系一直是生命科学领域研究的核心议题。近年来,随着深度学习的兴起,借助其强大的数据处理能力,让模型学习蛋白质序列、结构及其功能之间的映射关系,设计出具备更高稳定性、更强结合亲和力、更高酶活性的新型蛋白质,可以大幅提升蛋白质设计的效率,并有效降低其研发成本。 然而,现有方法通常需要在大规模数据集上训练一个参数量极大的模型,难以推广到同源序列稀少的特异蛋白上,往往也只能生成结构、功能相对简单的蛋白质。此外,实验验证表明
………………………………