文章预览
欢迎关注 在大模型参数量竞赛白热化的背景下,上海财经大学张立文教 授团队联合财跃星辰推出Fin-R1,以7B 参数规模在金融推理任务中逼近 671B 参数量的行业标杆 DeepSeek-R1,平均得分仅差 3 分。本文深度解析其数据构建 - 训练框架 - 场景落地全链路创新,揭示小参数模型如何突破金融 AI 的效率与成本瓶颈。 一、破局之作:小参数撬动大场景 2025 年 3 月,人工智能领域迎来一场 “以小搏大” 的技术革命。上海财经大学金融大语言模型课题组(SUFE-AIFLM-Lab)与财跃星辰联合开源的Fin-R1 金融推理大模型,以70 亿参数(7B)的轻量化架构,在权威评测中以75.2 分的平均分位列第二,仅落后于 671B 参数量的 DeepSeek-R1(78.2 分),却超越 70B 参数的 DeepSeek-R1-Distill-Llama-70B(69.2 分)达 6 分。这一成果打破了 “参数规模决定性能” 的行业定式,为金融 AI 的低成
………………………………