专栏名称: AI4Protein
读书破万卷juǎn,专注于AI蛋白相关的学术搬运。
今天看啥  ›  专栏  ›  AI4Protein

Nat. Biotechnol.|基于蛋白语言模型的超快速MSA搜索算法

AI4Protein  · 公众号  ·  · 2024-08-14 12:46

文章预览

DHR| 基于蛋白语言模型的超快速MSA搜索算法 2024年8月9日,一篇研究发布在 Nature Biotechnology ,题为《 Fast, sensitive detection of protein homologs using deep dense retrieval 》。该团队提出一个名为DHR(Dense Homolog Retriever)的蛋白同源序列检测算法。 DHR运用蛋白质语言模型和对比学习 ,能够快速且精准地在庞大的数据库中识别出蛋白质间的远亲关系。DHR打破了传统序列比对(MSA)方法的束缚,为生物信息学领域带来了一种新的、高效、快速的蛋白质同源序列检索工具,有助于推动AF3等结构预测模型的速度。 关键词 蛋白语言模型|MSA搜索|AI 研究背景 蛋白质同源序列是具有共同进化起源的蛋白质序列,它们在结构和功能上存在相似性。然而,传统的蛋白质同源序列检测方法,例如基于序列比对的PSI-BLAST和HMMER等,存在一些局限性: 灵敏度限制 :这些方法在识别序列 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览