文章预览
分子的计算表示可以采用多种形式,包括图结构、图的字符串编码、二进制向量或实值向量形式的学习分子表示。然后,使用广泛的机器学习模型将这些表示用于下游分类和回归任务。然而,现有的模型存在局限性,例如需要明确定义的化学键,而这通常不能代表分子的真正潜在性质。 2024年7月5日,瑞士洛桑联邦理工学院Maria Boulougouri等人在Nature Machine Intelligence上发表文章 Molecular set representation learning 。 作者提出了一个基于集合表示学习的分子机器学习框架。 研究表明,在最常用的化学基准数据集上,仅在原子不变集合上学习就可以达到最先进的基于图的模型的性能,并且在图神经网络(GNN)中引入集合表示层可以超越现有的化学和生物学领域中已建立的方法的性能。作者引入了专门的基于集合表示的神经网络架构,用于反应产率和蛋白质配
………………………………