注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
宝玉xp
·
//@张欣丨Kenn:在使用agent模式的 ...
·
21 小时前
黄建同学
·
41岁DeepMind天才科学家Felix ...
·
22 小时前
黄建同学
·
免费的,可以自己安装到本地(推荐),通过命令 ...
·
昨天
宝玉xp
·
//@Easy:不用手动啊,文档放到代码子目 ...
·
昨天
量子位
·
昆仑万维周亚辉:AGI时代也叫机器人时代,决 ...
·
2 天前
今天看啥
›
专栏
›
机器之心
只需几个演示就能对齐大模型,杨笛一团队提出的DITTO竟如此高效
机器之心
·
公众号
·
AI
· 2024-06-14 22:11
文章预览
机器之心报道 编辑:Panda 人类的教育方式,对大模型而言也很适用。 养育孩子时,古往今来人们都会谈到一种重要方法:以身作则。也就是让自己成为孩子模仿学习的范例,而不是单纯地告诉他们应该怎么做。在训练大语言模型(LLM)时,我们或许也能采用这样的方法 —— 向模型进行演示。 近日,斯坦福大学杨笛一团队提出了一种新框架 DITTO,可通过少量演示(用户提供的期望行为示例)来将 LLM 与特定设置对齐。这些示例可以从用户现有的交互日志获取,也能通过直接编辑 LLM 的输出得到。这样就可以让模型针对不同的用户和任务高效地理解并对齐用户偏好。 论文标题:Show, Don’t Tell: Aligning Language Models with Demonstrated Feedback 论文地址: https://arxiv.org/pdf/2406.00888 DITTO 可基于少量演示(少于 10)自动创建一个包含大量偏好比较数据的数据集( ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
宝玉xp
·
//@张欣丨Kenn:在使用agent模式的时候我的两个重要经验-20250104122343
21 小时前
黄建同学
·
41岁DeepMind天才科学家Felix Hill生前写的一篇-20250104120557
22 小时前
黄建同学
·
免费的,可以自己安装到本地(推荐),通过命令行或者本地浏览器转换-20250103212404
昨天
宝玉xp
·
//@Easy:不用手动啊,文档放到代码子目录下,cursor会-20250103135154
昨天
量子位
·
昆仑万维周亚辉:AGI时代也叫机器人时代,决定未来十年新首富
2 天前
新榜
·
不卷低价的主理人突围小红书,月销千万、复购率达70%
5 月前
人形机器人联盟
·
人民网头条报道中国煤科机器人公司河套具身智能中试基地
4 月前
学习强国
·
骄傲转发!中国3处入选
4 月前
神外资讯
·
【大会邀请函及日程】2024东方陆家嘴神经内镜与垂体瘤大会,10月10-12日
3 月前