文章预览
DHR| 基于蛋白语言模型的超快速MSA搜索算法 2024年8月9日,一篇研究发布在 Nature Biotechnology ,题为《 Fast, sensitive detection of protein homologs using deep dense retrieval 》。该团队提出一个名为DHR(Dense Homolog Retriever)的蛋白同源序列检测算法。 DHR运用蛋白质语言模型和对比学习 ,能够快速且精准地在庞大的数据库中识别出蛋白质间的远亲关系。DHR打破了传统序列比对(MSA)方法的束缚,为生物信息学领域带来了一种新的、高效、快速的蛋白质同源序列检索工具,有助于推动AF3等结构预测模型的速度。 关键词 蛋白语言模型|MSA搜索|AI 研究背景 蛋白质同源序列是具有共同进化起源的蛋白质序列,它们在结构和功能上存在相似性。然而,传统的蛋白质同源序列检测方法,例如基于序列比对的PSI-BLAST和HMMER等,存在一些局限性: 灵敏度限制 :这些方法在识别序列
………………………………