专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

专知  · 公众号  ·  · 2024-10-12 12:00
    

文章预览

随着深度学习逐渐渗透到计算机视觉和自然语言处理等领域,并越来越多地与对人类有影响的大型关键系统相集成,解决人工智能的安全性问题已成为该领域的核心挑战之一。在这些重要系统中,目标不仅仅是构建最准确的AI模型,而是要构建那些同时具备高准确性和可证明安全性的AI模型。本论文探讨了人工智能安全性的两个重要方面:鲁棒性和公平性。鲁棒性要求模型在输入分布与训练期间遇到的分布不同时也能良好表现。公平性是一种安全属性,要求模型预测在不同个体和群体间保持公平。 在论文的第一部分,我们聚焦于鲁棒性。我们首先提出了一种新颖的认证方法,可以保证模型对输入变换具有鲁棒性。在第二章中,我们将此方法扩展到训练模型,使其能够证明鲁棒性。这些贡献基于诸如通过优化和采样进行认证的创新技术,以及通过在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览