专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

直播预告 | 大语言模型与视觉语言模型越狱行为及防御机制的回顾与展望

PaperWeekly · 公众号 · 科研 · 2024-08-30 23:22

文章预览

AI安全说第1期嘉宾在线解读 ✔️ 在线实时Q ✔️ 直播主题大语言模型与视觉语言模型越狱行为及防御机制的回顾与展望直播嘉宾张沛炎香港科技大学在读博士生金海波伊利诺伊大学厄巴纳-香槟分校在读博士生直播时间 2024年08月31日（周六） 10:00-11:00 观看方式 PaperWeekly视频号 PaperWeekly B站直播间一键预约直播 ▼ 报告介绍人工智能通过大语言模型（LLM）和视觉语言模型（VLM）的发展迅速进步，在多个技术领域带来了显著的提升。虽然这些模型增强了自然语言处理和视觉交互任务的能力，但它们的广泛应用也引发了关于安全性和伦理对齐的重要问题。本次 talk 将广泛回顾这一新兴领域，重点探讨绕过 LLM 和 VLM 伦理和操作边界的刻意行为，即所谓的“越狱”行为，以及由此引发的防御机制的发展。我们将越狱行为分为七种不 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

募格学术 · 力荐！教育部课题申报来了，想一次就中标必看的指南

2 天前

自然系列 · 我为什么选择在《科学报告》发表论文？| 第一期

2 天前

循迹晓讲 · 知识专辑 | 钱文忠：玄奘大师的身世之谜

8 月前

TopEDB智能分析黑布林北海居 · 【宏观】2024年二季度英国实际GDP初值同比增长0.3% 环比增0.6%

6 月前

中建四局 · 勤俭办企｜练好勤俭基本功，“俭”出发展新成效③

3 月前

1818黄金眼 · 等了将近七个月，她感觉被“耍”了

1 周前