2024-07-14 05:38
本条微博链接
通过词汇表分析、平行语料增强等关键技术设计,在LLaMA基础上进行大规模多语言持续预训练,得到LLaMAX系列模型,极大提升了百余语言翻译性能,是目前最强的开源多语言解码器模型。
[CL]《LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages》Y Lu, W Zhu, L L
………………………………