文章预览
来源:专知 本文 约1000字 ,建议阅读 5 分钟 本论文旨在从安全性和可靠性的角度推动 代码机器学习 领域的发展。 通过代码数据学习来解决软件任务的编程工具 在提升开发人员生产力方面展现了早期的潜力。然而,这些工具在鲁棒性方面以及它们对软件安全性和可靠性的最终影响上仍然存在显著差距——这些问题甚至对经验丰富的开发人员来说仍是挑战。本论文旨在从安全性和可靠性的角度推动 代码机器学习 领域的发展。我们提出了训练机器学习模型的新技术,以使其具备强大的推理能力,能够处理与安全性和可靠性相关的问题。 我们首先介绍了利用 监督学习信号 来增强程序分析的方法。作为这一方法的实例,我们提出使用模仿学习框架,从符号执行中学习一个有效且快速的模糊测试器。首先,符号执行专家为大量程序生成高质量输入数据
………………………………