专栏名称: 晚点LatePost
为读者和社会提供可靠的商业信息和商业故事
今天看啥  ›  专栏  ›  晚点LatePost

【字节展示自研模型性能超 DeepSeek-R1,而且参数更少】-20250411233756

晚点LatePost  · 雪球动态  ·  · 2025-04-11 23:37
    

文章预览

2025-04-11 23:37 本条链接 【字节展示自研模型性能超 DeepSeek-R1,而且参数更少】字节豆包大模型团队公布推理模型 Seed-Thinking-v1.5 的技术报告。它是一个类似 DeepSeek-R1 的 MoE 架构推理模型。字节在技术报告中展示,该模型有 2000 亿参数,每次回答问题激活 200 亿参数,多个领域的基准测试得分超过 6710 亿参数的 DeepSeek-R1。3 月,字节大模型应用豆包上线正在深度思考功能,可能是由这款模型提供支持。(文丨晚点财经 贺乾 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览