专栏名称: 中国信通院CAICT
中国信息通信研究院是我国信息通信研究领域最重要的支撑单位和工信部在综合政策领域主要的依托单位。此账号用于发布ICT权威观点、产业发展分析,以及相关政策解读。
今天看啥  ›  专栏  ›  中国信通院CAICT

AI Safety Benchmark大模型安全基准测试2024 Q2版结果发布

中国信通院CAICT  · 公众号  ·  · 2024-07-30 09:30

文章预览

随着大模型技术的快速迭代和相关应用的不断扩展,其安全问题日益受到社会各界的广泛关注。大模型越狱攻击,提示词注入攻击等恶意手段层出不穷,给大模型落地应用带来严重威胁。 面向产业界对人工智能应用安全问题的治理需求,以《生成式人工智能服务安全基本要求》(征求意见稿)为指导文件,中国信息通信研究院(简称“中国信通院”)人工智能研究所依托中国人工智能产业发展联盟(AIIA)安全治理委员会联合30余家单位发起了大模型安全基准测试 2024 AI Safety Benchmark Q2版测试工作。本次测试以模型安全为核心测评目标,应用多种攻击手段对大模型开展对抗性测试。 测试维度 2024 AI Safety Benchmark Q2涵盖了底线红线、信息泄露和社会伦理等3个大的测试维度,并进一步结合了16种攻击方法,总计80余种攻击模板。具体评测体系如下: 测试特 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览