专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

73页，开源「后训练」全流程！AI2发布高质量Tülu 3系列模型，拉平闭源差距，比肩GPT-4o mini

新智元 · 公众号 · AI · 2024-12-10 15:00

文章预览

新智元报道编辑：LRS 【新智元导读】 Allen Institute for AI（AI2）发布了Tülu 3系列模型，一套开源的最先进的语言模型，性能与GPT-4o-mini等闭源模型相媲美。Tülu 3包括数据、代码、训练配方和评估框架，旨在推动开源模型后训练技术的发展。只进行过「预训练」的模型是没办法直接使用的，存在输出有毒、危险信息的风险，也无法有效遵循人类指令，所以通常还需要进行后训练（post-train），如「指令微调」和「从人类反馈中学习」，以使模型为各种下游用例做好准备。早期的后训练工作主要遵循InstructGPT等模型的标准方案，如指令调整（instruction tuning）和偏好微调（preference finetuning），不过后训练仍然充满玄学，比如在提升模型编码能力的同时，可能还会削弱模型写诗或遵循指令的能力，如何获得正确的「数据组合」和「超参数」，使模型在 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 回复@用户7901392097:Claude文笔好上下文长比较适-20241214230453

2 天前

宝玉xp · 回复@Brady_Il:可以注册了//@Brady_Il:sor-20241214230957

2 天前

爱可可-爱生活 · 「AI说：对话的背后到底是什么？」当我们说“对话”时，究竟是什么-20241212213434

4 天前

潦草学者 · AI 虚拟陪伴一年谈

5 天前

黄建同学 · 7 种最流行的 RAG 架构的对照表#ai##chatgpt#C-20241211214400

5 天前

清华MBA · 报名倒计时！2025级清华科技创新MBA项目体验营等你来

6 月前

新浪科技 · 【#中国奢侈品消费遇冷#】#奢侈品行业陷入寒冬#昨晚奢侈品行业最-20240724170000

4 月前