分享最新一线AI大模型、云原生、智能算力架构技术
目录
相关文章推荐
历史大学堂  ·  中了2000万 ·  昨天  
鱼羊史记  ·  通话时间分析 ·  昨天  
今天看啥  ›  专栏  ›  AI云原生智能算力架构

突发!开源!首个金融领域推理大模型Fin-R1:仅7B参数,逼近DeepSeek满血版效果

AI云原生智能算力架构  · 公众号  ·  · 2025-03-21 15:21
    

文章预览

欢迎关注 在大模型参数量竞赛白热化的背景下,上海财经大学张立文教 授团队联合财跃星辰推出Fin-R1,以7B 参数规模在金融推理任务中逼近 671B 参数量的行业标杆 DeepSeek-R1,平均得分仅差 3 分。本文深度解析其数据构建 - 训练框架 - 场景落地全链路创新,揭示小参数模型如何突破金融 AI 的效率与成本瓶颈。 一、破局之作:小参数撬动大场景 2025 年 3 月,人工智能领域迎来一场 “以小搏大” 的技术革命。上海财经大学金融大语言模型课题组(SUFE-AIFLM-Lab)与财跃星辰联合开源的Fin-R1 金融推理大模型,以70 亿参数(7B)的轻量化架构,在权威评测中以75.2 分的平均分位列第二,仅落后于 671B 参数量的 DeepSeek-R1(78.2 分),却超越 70B 参数的 DeepSeek-R1-Distill-Llama-70B(69.2 分)达 6 分。这一成果打破了 “参数规模决定性能” 的行业定式,为金融 AI 的低成 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览