10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

机器学习研究组订阅 · 公众号 · AI · 2024-08-16 18:42

文章预览

Llama 3.1的405B模型终于等来了首个微调版本！这个模型名为Hermes 3，来自初创公司Nous Research，是一个相当小型且低调的团队。虽然公司低调，但技术实力相当强悍。Hermes系列已经微调了Mistral、Yi、Llama等多个开源模型，下载量超过3300万次。跟着模型一起发布的，还有完整的技术报告和博客，Lambda Chat也同时在聊天界面中集成了模型。从技术报告和博客来看，Nous Research的这次微调颇有成效，在使用了FP8量化后还能保持相当水准的模型性能。这种优化有效地将模型的VRAM和磁盘需求降低了约50%，使其能够在单个节点上运行，方便更多开发者部署使用。除此之外，SFT和DPO的微调过程经过了专门设计，让模型的对话能力和指令遵循能力大大增强，擅长复杂的角色扮演和创意写作。除了创造力，Hermes 3还扩展出了函数调用、分步推理等智能体相关的功能， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · Windsurf 官方发布了一个 Demo 项目，教大家如何使用-20241125120346

13 小时前

调研纪要 · 又又又大涨了

昨天

调研纪要 · 又又又大涨了

昨天

爱可可-爱生活 · 【bomoto：一个专业的人体模型工具包，用于对网格进行人体模型-20241124165430

昨天

量子位 · 陶哲轩宣布“等式理论计划”成功，人类AI协作，57天完成2200万+数学关系证明

2 天前

爱可可-爱生活 · 【电子印章工具：Draw Stamp Utils，一个用Java-20241119133950

6 天前

新材料在线 · 倒计时23天丨2024国际胶粘剂及密封剂展最全观展指南，参展品牌、观众登记、入场、交通、现场会议看这里

3 月前