今天看啥  ›  专栏  ›  机器之心

弥补中文短板,社区Llama3汉化微调版效果如何?

机器之心  · 公众号  · AI  · 2024-05-22 04:39
    

文章预览

Llama3自上个月发布以来,被称为社区最强开源模型。 由于中文能力欠缺,为了弥补这一短板 ,开源社区已经出现了多个基于Llama3进行中文优化的微调模型。 这些微调模型大多采用了以下 2 条路线: 1、中文语料+ SFT 2、中文语料+增训+SFT 和通过中文基准来评估模型的性能不同,我们想和大家一起来 实测模型在不同场景下的实际表现 ,来看Llama3汉化后模型的能力,以提高模型被应用的效率。 我们要怎么测模型? 我们将会在5月20~5月24日开放以下模型项目供大家实际测试 (开放地址: https://sota.jiqizhixin.com/xt-terminal)。    项目名称          微调技术方法        项目地址 Chinese-LLaMA-Alpaca-3 v1版本(PT+SFT,基于非Instruct版训练):在原版Llama-3-8B的基础上使用约120GB大规模语料进行增量中文训练,并且利用高质量指令数据进行精调。 v2版本(SFT,基于In ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览