大模型专题：2024年如何提升大模型任务能力报告

人工智能学派 · 公众号 · · 2024-12-02 21:13

文章预览

如何下载资料？微信扫下方二维码加入星球平台【老会员续费特惠】今天分享的是：大模型专题：2024年如何提升大模型任务能力报告报告共计：39页该报告主要探讨如何提升大模型任务能力。ChatGPT的实现过程包括原始数据收集、预训练、指令微调、奖励函数设定和强化学习等阶段，其能力获取需精心设计，任务叠加可能影响部分任务能力。预训练阶段，模型通过对大量数据学习知识，需大量重复知识点，高质量数据很重要，模型可达到2bit/参数的知识存储能力，否则微调无用。有监督微调阶段有四种训练方式，实验表明参数量大的模型在相同数据量训练时性能优越，混合数据在低资源场景提升性能、高资源场景则下降，数据量影响性能，DMT策略可缓解性能冲突。大规模微调会破坏世界知识，LoRA+MoE方法可缓解此问题，同时提升世界知识基准和 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博