文章预览
科情智库 9月18日,清华大学的研究团队最近提出了一种名为Frad(分数去噪)的分子预训练框架。该框架通过引入化学先验知识来改进分子分布建模,从而提高分子性质预测的准确性和效率。Frad框架的核心思想是通过添加化学感知噪声(CAN)和坐标高斯噪声(CGN)的混合噪声来生成噪声构象,并训练模型从中预测CGN。这种方法允许噪声变得可自定义,以便纳入化学先验知识,从而显著增强分子分布的建模能力。具体而言,Frad框架利用等变图神经网络(GNN)从噪声构象中提取特征,并通过噪声预测头预测CGN。在一系列具有挑战性的下游任务中,Frad框架表现出色。在原子级力预测任务中,Frad在多个分子动力学数据集(如MD17、ISO17和MD22)中均优于基线方法。在分子级量子化学性质预测任务中,Frad在QM9数据集的12个任务中有9个任务取得了最先进的结果
………………………………