专栏名称: oldpan博客
老潘的博客,程序员眸中的fantasy life,分享AI技术干货,让大家少走弯路~
目录
相关文章推荐
BetterRead  ·  新初二二三事(五) ·  17 小时前  
今天看啥  ›  专栏  ›  oldpan博客

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

oldpan博客  · 公众号  ·  · 2025-01-19 19:48
    

文章预览

“尺度定律”之下,大模型除了要突破算力瓶颈,亦面临高质量数据即将“见底”难题。如何通过 “通专融合”技术路径 实现通用人工智能,正日益成为业内共识。 1月15日,上海人工智能实验室对书生大模型进行重要版本升级,书生·浦语3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。仅使用4T训练数据的InternLM3-8B-Instruct,其综合性能超过了同量级开源模型,节约训练成本75%以上;同时,书生·浦语3.0首次在通用模型中实现了常规对话与深度思考能力融合,可应对更多真实使用场景。 体验页面: https://internlm-chat.intern-ai.org.cn (点击文末阅读原文直达) GitHub链接 : https://github.com/InternLM/InternLM HuggingFa ce链接: https://huggingface.co/internlm ModelScope链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm3-8b-instruct 高思维密 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览