AMD使用自家GPU集群发布首个 1B 参数语言模型 AMD OLMo

AI工程化 · 公众号 · · 2024-11-03 15:09

文章预览

AMD 10月31日发布了其首个1亿参数语言模型系列——AMD OLMo，旨在推动可访问 AI 研究并赋能多样化的用户、开发者和研究社区。我们一起来了解这个模型有何独到之处。模型设计与训练模型架构与训练过程 AMD OLMo 系列包括三个主要模型： AMD OLMo 1B ：在 Dolma v1.7 子集上预训练。 AMD OLMo 1B SFT ：在 Tulu V2 和OpenHermes-2.5 、WebInstructSub 、Code-Feedback 数据集上进行监督微调。 AMD OLMo 1B SFT DPO ：使用 Direct Preference Optimization（DPO）在 UltraFeedback 数据集上进行对齐。数据与训练配方 AMD OLMo 的训练分为三个阶段：预训练：使用 Dolma v1.7 子集中的 1.3 万亿个 token 。监督微调（SFT）：分两阶段进行，首先在 TuluV2 上，然后在更大的数据集（包括 OpenHermes 2.5 、Code-Feedback 和WebInstructSub）上进行。对齐：使用 DPO 在UltraFeedback 数据集上进行。性能表现与效率基准测试结果 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

汇易咨询 · 2024年我国维生素行情回顾之一：价格脱底上行，猪市扭亏为盈功不可没

昨天

汇易咨询 · 禽类冻品市场再度阴跌，开年国内禽类市场命运多舛

昨天

汇易咨询 · 雨水与干旱的双重挑战，巴西新豆产量到底往上调、还是往下调？

昨天

王者荣耀 · 妲己宝宝不语，只一味地分享精彩创意！来看看源梦皮肤新花样~

2 天前

名城网事 · 最新通知：不得超过8小时！

2 天前

名城网事 · 最新通知：不得超过8小时！

2 天前

华南理工大学学生在线 · 2024年暑假心理咨询的安排来啦！

6 月前

中核集团 · 新系统上线！数智中核助力我国统计信息化建设迈入新阶段

5 月前