这里是AI领域学习交流的平台!分享人工智能、机器学习、深度学习、计算机视觉、自然语言处理、算法原理、科技前沿、行业动态等,为您提供最有价值的知识和资讯。
今天看啥  ›  专栏  ›  人工智能与算法学习

重磅!Qwen2.5的技术报告来了!

人工智能与算法学习  · 公众号  ·  · 2024-12-20 17:09
    

文章预览

报告详细介绍了 Qwen2.5 系列大型语言模型的开发和评估,包括其在预训练和后训练阶段的改进,以及新的多阶段强化学习方法,以及如何通过提供丰富的模型配置来处理多样化的使用场景。 摘要 报告揭示了 Qwen2.5 系列 LLMs 的详细技术背景,这些模型旨在满足多样化的需求。与前代模型相比,Qwen2.5 在预训练阶段通过使用从 7 万亿令牌扩展到 18 万亿令牌的高质量数据集显著提升了性能,增强了常识、专家知识和推理能力。在后训练阶段,Qwen2.5 实施了复杂的监督微调和多阶段强化学习,包括离线学习 DPO 和在线学习 GRPO,这些技术显著提高了人类偏好的对齐,并在长文本生成、结构化数据分析和指令跟随方面取得了进步。Qwen2.5 提供了丰富的模型配置,包括基础模型和指令微调模型,大小从 0.5B 到 72B 参数,并提供了量化版本。报告还展示了 Qwen2.5 在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览