专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

直播预告 | 上海交大刘鹏飞老师团队:大模型安全对齐技术前沿

PaperWeekly  · 公众号  · 科研  · 2024-11-01 19:43

文章预览

 AI安全说 第7期  嘉宾在线解读 ✔️ 在线实时Q ✔️  直播主题  大模型安全对齐技术前沿  直播嘉宾  刘一秀 上海交通大学硕士生 陈奕融 卡内基梅隆大学本科生  直播时间  2024年11日(周六) 19:30-21:00  观看方式  PaperWeekly视频号 PaperWeekly B站直播间 一键预约直播 ▼  报告介绍  01 大模型对齐与安全评估 近年来,随着人工智能技术的快速发展,大模型对齐问题日益凸显。由于预训练目标函数与人类价值观的潜在偏差,使得大模型的安全性评估与人类价值观的对齐成为亟待解决的重要课题。  本次 talk 将聚焦大模型面临的安全风险,介绍上海交通大学生成式人工智能团队在大模型对齐和安全评估方面的相关研究工作,包括事实性对齐、检索增强对齐等,确保模型输出与真实信息对齐、与法律条文对齐。  接着,介绍安全评估、元评估相关内容 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览