突发！开源！首个金融领域推理大模型Fin-R1：仅7B参数，逼近DeepSeek满血版效果

AI云原生智能算力架构 · 公众号 · · 2025-03-21 15:21

文章预览

欢迎关注在大模型参数量竞赛白热化的背景下，上海财经大学张立文教授团队联合财跃星辰推出Fin-R1，以7B 参数规模在金融推理任务中逼近 671B 参数量的行业标杆 DeepSeek-R1，平均得分仅差 3 分。本文深度解析其数据构建 - 训练框架 - 场景落地全链路创新，揭示小参数模型如何突破金融 AI 的效率与成本瓶颈。一、破局之作：小参数撬动大场景 2025 年 3 月，人工智能领域迎来一场 “以小搏大” 的技术革命。上海财经大学金融大语言模型课题组（SUFE-AIFLM-Lab）与财跃星辰联合开源的Fin-R1 金融推理大模型，以70 亿参数（7B）的轻量化架构，在权威评测中以75.2 分的平均分位列第二，仅落后于 671B 参数量的 DeepSeek-R1（78.2 分），却超越 70B 参数的 DeepSeek-R1-Distill-Llama-70B（69.2 分）达 6 分。这一成果打破了 “参数规模决定性能” 的行业定式，为金融 AI 的低成 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博