专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

AAAI 2025 | 武大团队提出SEAM框架：「强赋能弱监管」的弱到强泛化

PaperWeekly · 公众号 · 科研 · 2025-03-16 21:33

文章预览

©PaperWeekly 原创 · 作者 | 李永奇单位 | 武汉大学研究方向 | 自然语言处理 Background 在开始介绍我们的论文前，先简要介绍一下： 1 ）什么是 super-alignment ？ 2 ）什么是 weak-to-strong generalization （ W2SG ）？基于此，我们再详细介绍我们的 motivation 、 method 、 experiments 。 1 ） super-alignment ：人类如何对齐（可能出现的）能力超过人类的 superhuman AI ？ 2 ） weak-to-strong generalization （ W2SG ）： super-alignment 的类比实验。实验中，利用 weak model 来提供用于训练 strong model 的 supervision signals （也即 weak labels ）。其中， weak model 通常采用一个 aligned model （类比于 aligned humans ）， strong model 采用一个 unaligned model （类比于尚未与人类对齐的 superhuman AI ）。论文标题： Strong Empowered and Aligned Weak Mastered Annotation for Weak-to-Strong Generalizat ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博