注册登录

专栏名称: AI科技评论

点评学术，服务 AI ！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

庞门正道 · 春未来。 · 昨天

设计先锋队 · ThePentagon，比利时 · 23 小时前

厦门日报 · “比价神器”上线，买药必看！ · 2 天前

厦门日报 · 好利来通报表扬员工连续工作29小时？门店回应 · 3 天前

今天看啥 › 专栏 › AI科技评论

揭秘多轮越狱攻击新框架：RACE 如何利用大模型推理能力突破安全防线？

AI科技评论 · 公众号 · · 2025-02-21 18:42

文章预览

北航等单位提出RACE框架，攻击成功率高达96%，OpenAI、DeepSeek等主流模型均被攻破。本文一作为博士生应宗浩，现就读于北航复杂关键软件环境全国重点实验室，师从陶大程教授与刘祥龙教授，并由刘艾杉教授共同指导，目前研究兴趣为大模型越狱攻防。他所在的智能安全团队由刘祥龙教授负责，近年在大模型安全评测体系方面进行了系列研究工作,包括对抗攻击、后门投毒、越狱攻击、偏见调控等,发表TPAMI、IJCV、ICML、NeurIPS、USENIX等人工智能、信息安全领域顶级论文100余篇。大模型（LLMs）的推理能力在各类任务中表现出色，但这也为越狱攻击提供了新的突破口。近日，来自北京航空航天大学、360 AI安全实验室、新加坡国立大学和南洋理工大学的研究团队提出了一种名为RACE（Reasoning-Augmented Conversation）的多轮越狱攻击框架，通过将有害查询转化为良 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

庞门正道 · 春未来。

昨天

设计先锋队 · ThePentagon，比利时

23 小时前

厦门日报 · “比价神器”上线，买药必看！

2 天前

厦门日报 · 好利来通报表扬员工连续工作29小时？门店回应

3 天前

RRCG人人素材 · 末日废弃医院大型环境场景UE游戏素材

8 月前

数英DIGITALING · 户外超高篮球框，这个巨型广告牌好吸睛

8 月前

生物谷 · JAMA Netw Open. | 20年大规模队列研究发现，每天服用复合维生素不会降低早逝的风险

6 月前

FM93交通之声 · 消息传来，他已去世，年仅36岁！生前曾提醒远离……

4 月前

Steed的星空 · 勇士归来！| 夜空中国

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号