专栏名称: 大语言模型论文跟踪

用通俗的语言普及最新LLM进展！欢迎大家推荐论文！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

涵江时讯 · 莆田独一无二！珍稀的“菌中之王”红松茸上市啦 ... · 3 小时前

安徽消保委 · 第四届安徽特色伴手礼 | ... · 22 小时前

资中交警 · 平安春运交警同行 | ... · 2 天前

新黄河 · 刘诗诗将所持股权转让给吴奇隆 · 2 天前

南国早报 · 演员郑恺，被起诉！ · 2 天前

今天看啥 › 专栏 › 大语言模型论文跟踪

ASB：LLM智能体应用攻防测试数据集

大语言模型论文跟踪 · 公众号 · · 2024-10-07 20:09

文章预览

ABS：LLM智能体应用攻防测试数据集发布时间：2024 年 10 月 03 日 Agent应用 Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents 尽管基于 LLM 的代理能够通过外部工具和记忆机制解决复杂任务，但也可能带来严重安全风险。现有文献对这些代理的攻防评估并不全面。为此，我们推出了 Agent Security Bench (ASB)，一个综合框架，涵盖 10 个场景、10 个代理、400 多种工具、23 种攻防方法和 8 个评估指标。基于 ASB，我们测试了 10 种提示注入攻击、一种记忆中毒攻击、一种新颖的 Plan-of-Thought 后门攻击、一种混合攻击及 10 种防御措施，涉及 13 个 LLM 骨干网络，总计近 90,000 个测试案例。结果显示，代理在系统提示、用户提示处理、工具使用和记忆检索等阶段存在关键漏洞，最高平均攻击成功率达 84.30%，而当前防御措施效果有限，凸显了代理 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

涵江时讯 · 莆田独一无二！珍稀的“菌中之王”红松茸上市啦！快来萩芦“海市山野”基地采摘品尝！

3 小时前

涵江时讯 · 莆田独一无二！珍稀的“菌中之王”红松茸上市啦！快来萩芦“海市山野”基地采摘品尝！

3 小时前

安徽消保委 · 第四届安徽特色伴手礼 | 入围产品之二十：“长岭尖”牌山货礼盒

22 小时前

安徽消保委 · 第四届安徽特色伴手礼 | 入围产品之二十：“长岭尖”牌山货礼盒

22 小时前

资中交警 · 平安春运交警同行 | 四川公安交警曝光春季典型道路交通事故

2 天前

资中交警 · 平安春运交警同行 | 四川公安交警曝光春季典型道路交通事故

2 天前

新黄河 · 刘诗诗将所持股权转让给吴奇隆

2 天前

新黄河 · 刘诗诗将所持股权转让给吴奇隆

2 天前

南国早报 · 演员郑恺，被起诉！

2 天前

南国早报 · 演员郑恺，被起诉！

2 天前

AINLP · 用 Sentence Transformers v3 训练和微调嵌入模型

8 月前

琦叔GRE · 新教主刘旸在大杀四方，老教主很欣慰

5 月前

深度学习与NLP · 他回国了！加盟C9大学！

4 月前

芯智讯 · 2025年将有18座新晶圆厂开工，全球产能将达3360万片/月

1 月前

天津市应急管理局 · 天津：多举措开展“小火亡人”火灾防控工作

1 周前