大模型训练成本降一半！厦大和vivo联合推出预训练新策略，给LLM降本增效

夕小瑶科技说 · 公众号 · · 2024-10-31 17:05

文章预览

夕小瑶科技说原创作者 | 王志豪鱼与熊掌可以兼得，厦门大学和vivo AI lab联合提出预训练学习率调整新策略，降低训练42%成本的同时，还能保持大模型效果，该成果已发表于AI领域的顶级会议EMNLP2024。近年来，大语言模型（Large Language Models, LLMs）的研究取得了重大进展，并对各个领域产生了深远影响。然而，LLMs的卓越性能来源于海量数据的大规模训练，这导致LLMs的训练成本明显高于传统模型。此外在实际应用中，新数据的不断涌现使LLMs需要不断进行版本更新来保持性能优势，这加剧了LLMs的训练成本。为了探索如何在降低训练成本的同时确保不同版本LLMs的性能，来自厦门大学和vivo的研究员共同展开研究，在EMNLP2024联合提出了一种能更好地平衡版本更新时LLMs的性能和成本的训练范式，并应用于vivo的蓝心大模型训练。论文标题： A Learning Rate Path S ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

笔吧评测室 · 英特尔 Panther Lake 处理器被曝核显非单一代工，台积电、英特尔 3nm 正面交锋

昨天

笔吧评测室 · 联想前产品经理入职荣耀，透露笔记本产品将“调整队形”

2 天前

笔吧评测室 · 零刻 EQ14 迷你主机发布：英特尔 N150、内置电源，准系统首销 599 元

2 天前

笔吧评测室 · 高通将推更便宜的骁龙 X 系列芯片，用于 600 美元档 Windows PC

2 天前

笔吧评测室 · 聊一款“幽默”的笔记本

6 天前

飓风网络安全 · 【漏洞预警】Fortinet Fortiproxy未授权外部资源引用不当漏洞可致远程代码执行

1 月前