专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

36氪Pro · 专注机器人智能建造，天凛获得数千万级别融资 ... · 11 小时前

济南时报 · 山东第一个，济南造！人形机器人又“进化”了 · 昨天

FM1007福建交通广播 · 宇树科技携两款机器人亮相2025GDC · 3 天前

封面新闻 · 铜梁龙马明日开跑！ · 3 天前

今天看啥 › 专栏 › AINLP

告别随机采样！PRS：一种简单高效的数据采样新方法

AINLP · 公众号 · · 2024-11-08 17:28

文章预览

Hai Ye, et al. “ Preference-Guided Reflective Sampling for Aligning Language Models ” -- EMNLP2024 论文：https://arxiv.org/pdf/2408.12163 项目：https://data-sampling-prs.github.io 代码：https://github.com/nusnlp/PRS 1. 前言大型语言模型（LLMs）在后训练阶段需要与人类偏好进行对齐，而在这一对齐和优化过程中，采样方法尤为关键，特别是在数据生成和模型再训练的迭代阶段。传统的随机采样方法尽管广泛应用，但在探索效率和生成质量上存在明显局限。因此，研究人员提出了一种更高效的采样方法，称为偏好引导反思采样（Preference-Guided Reflective Sampling, PRS 。与随机采样不同，PRS 采用树状生成框架，并结合自我改进技术，从而显著提升采样效率。此外，PRS 允许用户通过自然语言表达偏好，从而优化模型生成的内容，更好地满足多样化的需求。实验结果表明，与传统的随机采样方法相 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

36氪Pro · 专注机器人智能建造，天凛获得数千万级别融资 | 36氪首发

11 小时前

36氪Pro · 专注机器人智能建造，天凛获得数千万级别融资 | 36氪首发

11 小时前

济南时报 · 山东第一个，济南造！人形机器人又“进化”了

昨天

济南时报 · 山东第一个，济南造！人形机器人又“进化”了

昨天

FM1007福建交通广播 · 宇树科技携两款机器人亮相2025GDC

3 天前

FM1007福建交通广播 · 宇树科技携两款机器人亮相2025GDC

3 天前

封面新闻 · 铜梁龙马明日开跑！

3 天前

封面新闻 · 铜梁龙马明日开跑！

3 天前

清廉临安 · 天目山镇门口村：“洪”扬廉洁文化筑起门口“红线”

7 月前

喵大白话 · 每日一问：感情里必须知道的一个道理？

6 月前

壹心理 · 非专业出身也能学心理咨询吗？

2 月前