专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

Anthropic 最近发布了一项名为“Best-of-N Ja-20241216192310

黄建同学  · 微博  · AI  · 2024-12-16 19:23
    

文章预览

2024-12-16 19:23 本条微博链接 Anthropic 最近发布了一项名为“Best-of-N Jailbreaking”的研究合作,展示了一种简单且通用的方法,能够绕过前沿 AI 模型的安全机制。这种方法不仅适用于文本,还可应用于视觉和音频模型。 这里有很多例子,太**了,大家自己去看:jplhughes.github.io/bon-jailbreaking/#examples 以下是研究的主要发现和方法总结:#ai##chatgpt# ★ 方法原理 Best-of-N 通过对提示(prompts)进行小幅度修改来实现,比如随机调整大 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览