只需几个演示就能对齐大模型，杨笛一团队提出的DITTO竟如此高效

机器之心 · 公众号 · AI · 2024-06-14 22:11

文章预览

机器之心报道编辑：Panda 人类的教育方式，对大模型而言也很适用。养育孩子时，古往今来人们都会谈到一种重要方法：以身作则。也就是让自己成为孩子模仿学习的范例，而不是单纯地告诉他们应该怎么做。在训练大语言模型（LLM）时，我们或许也能采用这样的方法 —— 向模型进行演示。近日，斯坦福大学杨笛一团队提出了一种新框架 DITTO，可通过少量演示（用户提供的期望行为示例）来将 LLM 与特定设置对齐。这些示例可以从用户现有的交互日志获取，也能通过直接编辑 LLM 的输出得到。这样就可以让模型针对不同的用户和任务高效地理解并对齐用户偏好。论文标题：Show, Don’t Tell: Aligning Language Models with Demonstrated Feedback 论文地址： https://arxiv.org/pdf/2406.00888 DITTO 可基于少量演示（少于 10）自动创建一个包含大量偏好比较数据的数据集（ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · //@蚁工厂:这个价格，机器人上的手机和笔记本的钱应该没算进去？-20250321211255

昨天

爱可可-爱生活 · 【[699星]Second-Me：打造你的专属AI分身，放大你的-20250321134408

昨天

黄建同学 · 不敢相信这是用v0生成的↓一定要看到最后（就这么一键生成3D了）-20250321120606

昨天

新智元 · 微软腾讯合体开大！上千网红爆款涌进桌面，PC手机次元壁崩塌

昨天

雨生云计算 · 黄仁勋深度解读DeepSeek R1：推理型AI的算力需求是传统模型的100倍

昨天

雨生云计算 · 黄仁勋深度解读DeepSeek R1：推理型AI的算力需求是传统模型的100倍

昨天

高分子科学前沿 · 水凝胶，最新Nature Nanotechnology！

6 月前

GEE遥感训练营 · Science正刊|全球高分辨率潮汐湿地动态分布

5 月前

科技日报 · 警惕微信群“钓鱼”！发现一木马病毒最新变种

4 月前

人力资源研究 · 厉害了！迟到3次就能辞退！公司这样操作一分不赔！

2 月前