专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【[391星]Fin-R1:一款专为金融领域设计的推理大模型,助-20250329124713

爱可可-爱生活  · 微博  · AI  · 2025-03-29 12:47
    

文章预览

2025-03-29 12:47 本条微博链接 【[391星]Fin-R1:一款专为金融领域设计的推理大模型,助力金融机构高效解决复杂金融推理问题。亮点:1. 仅7B参数量,部署成本低;2. 在金融推理任务中表现卓越,如FinQA得分76.0,ConvFinQA得分85.0;3. 采用SFT和RL两阶段训练,提升模型准确性和泛化能力】 'Fin-R1: A financial reasoning large language model driven by reinforcement learning' GitHub: github.com/SUFE-AIFLM-Lab/Fin-R1 #金融推理# #大语言模型# #强化学习# #A ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览