文章预览
©PaperWeekly 原创 · 作者 | 李永奇 单位 | 武汉大学 研究方向 | 自然语言处理 Background 在开始介绍我们的论文前,先简要介绍一下: 1 )什么是 super-alignment ? 2 )什么是 weak-to-strong generalization ( W2SG )?基于此,我们再详细介绍我们的 motivation 、 method 、 experiments 。 1 ) super-alignment :人类如何对齐(可能出现的)能力超过人类的 superhuman AI ? 2 ) weak-to-strong generalization ( W2SG ): super-alignment 的类比实验。实验中,利用 weak model 来提供用于训练 strong model 的 supervision signals (也即 weak labels )。其中, weak model 通常采用一个 aligned model (类比于 aligned humans ), strong model 采用一个 unaligned model (类比于尚未与人类对齐的 superhuman AI )。 论文标题 : Strong Empowered and Aligned Weak Mastered Annotation for Weak-to-Strong Generalizat
………………………………