注册
登录
专栏名称:
PaperAgent
日更,解读AI前沿技术热点Paper
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
国际科学
·
最佳生活方式出炉!研究建议:养成这些习惯,能 ...
·
5 天前
健康中国
·
孩子过敏性鼻炎,如何缓解?儿童肺炎支原体感染 ...
·
5 天前
鼠绘情报站
·
美女剑豪带着肉来了!这是尾田笔下的平行世界里 ...
·
6 天前
HRU视界
·
好书推荐 | ...
·
6 天前
HRU视界
·
好书推荐 | ...
·
6 天前
今天看啥
›
专栏
›
PaperAgent
腾讯AI Lab技术报告:一种以10亿人物角色驱动的新颖数据构造方法
PaperAgent
·
公众号
· · 2024-07-01 18:55
文章预览
大规模创建合成数据并非易事,尤其是确保数据的多样性。以往的研究尝试通过 实例驱动或关键点驱动 的方法来增加数据的多样性,但这些方法在可扩展性上存在限制。 为了解决这些问题,提出了一种新颖的 人物角色(Personas)驱动的数据合成方法 ,利用大型语言模型(LLM)中的多种视角来创建多样化的合成数据。 人物角色可以与广泛的数据合成提示 (例如,创建一个数学问题或用户提示)一起工作,以指导大型语言模型(LLM)合成具有相应视角的数据。人物角色中心中的 10亿个人物角色 可以促进在十亿规模上为各种数据合成场景创建合成数据。 “人物角色库”(Persona Hub): 一个从网络数据自动策划的包含10亿个不同人格的集合。这些人格作为世界知识的分布式载体,可以深入LLM中的几乎所有视角,从而促进大规模创建多样化的合成数据。 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
国际科学
·
最佳生活方式出炉!研究建议:养成这些习惯,能显著延缓衰老,降低死亡率!
5 天前
健康中国
·
孩子过敏性鼻炎,如何缓解?儿童肺炎支原体感染有哪些症状,如何治疗?| 时令节气与健康
5 天前
鼠绘情报站
·
美女剑豪带着肉来了!这是尾田笔下的平行世界里的《海贼王》
6 天前
HRU视界
·
好书推荐 | 西京医院乳腺癌专家主编——《乳腺癌患者生育力保护》
6 天前
HRU视界
·
好书推荐 | 西京医院乳腺癌专家主编——《乳腺癌患者生育力保护》
6 天前
全国体外诊断网 CAIVD
·
国务院发文:地方政府不得为公司上市提供奖励、中介机构收费不得与IPO结果挂钩
3 月前
生物岛
·
Nat Commun | 东北师范大学王杨等团队研究表明甲硫氨酸-SAM代谢依赖的泛醌合成对铁死亡诱导中ROS的积累至关重要
1 月前
钱江晚报
·
“余华英拐卖儿童案”受害者杨妞花:为父母,我能成为战士!
1 月前