今天看啥  ›  专栏  ›  DrugAI

解开分子结构:用于化学的多模态光谱数据集

DrugAI  · 公众号  ·  · 2024-08-27 00:01

文章预览

DRUG AI 今天为大家介绍的是来自Teodoro Laino团队的一篇论文。光谱技术是确定分子结构的重要工具。不同的光谱技术,如核磁共振(NMR)、红外光谱和质谱,可以深入了解分子结构,包括官能团的存在或缺失。化学家利用这些方法的互补性来获得优势。然而,由于缺乏包含多种光谱技术数据的综合多模态数据集,机器学习方法在从光谱预测分子结构的任务中,主要限于单一模态。本文引入了一个数据集,包含从专利数据中的化学反应中提取的79万种分子的模拟1H-NMR、13C-NMR、HSQC-NMR、红外和质谱(正负离子模式)光谱数据。该数据集使得可以开发基础模型来整合多种光谱模态的信息,模拟人类专家的分析方法。此外,作者提供了用于评估单一模态任务的基准,如结构解析、目标分子的光谱预测和官能团预测。该数据集有望自动化结构解析,简化从合成 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览