今天看啥  ›  专栏  ›  NLP工作站

一大堆Llama3.1-Chinese正在袭来

NLP工作站  · 公众号  ·  · 2024-07-27 20:31

文章预览

写在前面 大家好,我是刘聪NLP。 Llama3.1模型已经开源,在这短短几天之内,也是出现了一些Llama3.1汉化的repo,开源社区也是相当的卷。 主要是Llama3.1没有关注中文,虽然是多语言,但主要针对英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。 虽然让Llama3.1系列模型用中文回答时,也可以正常回答,但仍然有中英文混合现象,并且词表是真没中文呀,中文场景下解码效率会比较低。 咋说呢?反正也给中文大模型更多机会吧,开源社区也有更多事情可以做。 对Llama3.1进行中文增强,当然还是那几步:扩充中文词表、中文数据continue-pretrain、中文sft。 下面先简单过一下Llama3.1的一些介绍和效果,再给大家分享一些已经开源的Chinese-Llama3.1项目。 Llama3.1介绍和效果 前几天关于Llama3.1的介绍其实一大堆了,我就不过的介绍了,可以看我之 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览