专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

新智元  · 公众号  · AI  · 2024-08-19 13:08
    

文章预览

   新智元报道   编辑:桃子 【新智元导读】 合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。 全世界高质量数据几乎枯竭。 AI科学家们为了解决这一难题,可谓是绞尽脑汁。 目前来看,合成数据或许就是大模型的未来,也成为业界公认的解决之法。 就连英伟达科学家Jim Fan曾发文表示,合成数据将提供下一万亿个高质量的训练token。 但是,用合成数据,并非完全对LLM训练有帮助。 前段时间,Nature封面研究显示,合成数据迭代9次后,会让大模型崩溃。而且,类似的研究比比皆是。 那么,我们该怎么办呢? 最近,微软团队提出了可扩展的智能体框架——AgentInstruct,可自动创建大量多样化、高质量的合成数据。 它最大 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览