AlphaMissense的本地使用

小王随笔 · 公众号 · · 2024-09-02 22:21

主要观点总结

文章介绍了DeepMind开源的AlphaMissense（AM）的推理代码和数据集，包括模型的开源内容、预测数据的获取和使用，以及相关的工具和资源。文章还提到了AM在蛋白质结构预测和致病性评估中的应用，以及相关研究的影响力和数据使用的注意事项。

关键观点总结

关键观点1: AlphaMissense的开源内容

DeepMind开源了AlphaMissense的推理代码和一个数据集，包括模型及其训练损失的详细实现、用于生成推理输入特征的数据管道，以及所有可能的人类蛋白质的残基替换和错义突变的致病性打分的预测结果。但DeepMind没有开源AM的模型权重，因此用户无法自行进行推理预测。

关键观点2: AlphaMissense预测数据的获取和使用

用户可以通过下载预计算数据和使用相关工具进行AlphaMissense预测。预计算数据是压缩后的纯文本的制表符分隔值（TSV）文件，可通过Zenodo或谷歌云下载。用户还可以使用Ensembl变异效应预测工具的AM插件或Hegedűs课题组开发的在线服务器进行预测。

关键观点3: Hegedűs课题组的贡献

Hegedűs课题组集成了AlphaMissense的数据，并在所有人蛋白质的AF2预测结构中加入了AM的致病性预测打分。他们还制作了在线服务器，可供用户检索和交互式查看蛋白质结构与致病性的关系。

关键观点4: 数据使用和许可要求

使用AlphaMissense的源码、预测数据等需要参照其许可和论文及数据集引用要求。

文章预览

一、AlphaMissense开源的内容简单地说，DeepMind开源了 AlphaMissense（以下简称AM）的推理代码和一个数据集，即所有人类蛋白质的AM预测结果。但是， DeepMind没有开源AM的模型权重。因此，即使用户安装AM，也无法进行推理预测。具体来说，DeepMind开源的内容如下：（1）AM模型及其训练损失的详细实现（modules_missense.py）；（2）用于生成推理输入特征的数据管道（pipeline_missense.py）；（3）所有可能的人类蛋白质的残基替换和错义突变的致病性打分的预测结果。在AM的开源情况下，安装AM的实际应用的意义并不大，我们不做介绍，有意复现训练者不妨参考GitHub上AM的官方源码页面的安装指南，如下： https://github.com/google-deepmind/alphamissense/ 。我们下面介绍AM的预计算数据集的使用。二、AlphaMissense预测数据的获取和使用 1. 通过AM预测数据。 AM作者将预计算数 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博