专栏名称: AI TIME 论道

AI TIME是一群关注人工智能发展，并有思想情怀的青年学者创办的圈子，旨在发扬科学思辨精神，邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索，链接全球AI学者，以辩论的形式探讨人工智能领域的未来。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

长视频生成、尝试性检索、任务推理 | Big Model Weekly 第56期

AI TIME 论道 · 公众号 · · 2025-02-15 14:00

文章预览

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！ 01 COMAL:AConvergent Meta-Algorithm for Aligning LLMs with General Preferences 许多对齐方法，包括基于人类反馈的强化学习（RLHF），依赖于布拉德利-特里（Bradley-Terry）奖励假设，然而这一假设无法充分捕捉人类偏好的全范围。为了实现与一般偏好的稳健对齐，本文将对齐问题建模为一个二人零和博弈，其中纳什均衡策略能够保证在对抗任何竞争策略时的胜率达到50%。然而，以往用于寻找纳什策略的算法要么发散，要么收敛到修改后的博弈中的纳什策略，即使在简单的合成环境中，也无法保持对所有其他策略的50%胜率保证。本文提出了一种用于语言模型与一般偏好对齐的元算法——收敛性元对齐算法（Convergent Meta Alignment Algorithm, COMAL），其灵感来源于博弈论中的收敛算法。理论上，本研究证明该元算法在最终迭 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博