专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

ICLR 2025 多语言大模型相关论文速览

AINLP  · 公众号  ·  · 2024-11-23 21:40
    

文章预览

©  作者| 罗文扬 机构|中国人民大学 研究方向| 大语言模型 Dataset and benchmark MMTEB: Massive Multilingual Text Embedding Benchmark 文本嵌入通常仅在有限的任务集上进行评估,这些任务在语言、领域和任务类型上都较为单一。为了突破这一限制并提供更全面的评估,我们提出了大规模多语言文本嵌入基准(MMTEB)。这是一个由社区驱动的大规模扩展项目,将MTEB扩展到超过500个质量受控的评估任务,涵盖超过1,000种语言。MMTEB包含了一系列具有挑战性的全新任务,例如指令跟随、长文档检索和代码检索,成为迄今为止针对嵌入模型的最大多语言评估任务集合。 Mexa: Multilingual Evaluation of English-Centric LLMs via Cross-Lingual Alignment 英语为中心的大语言模型(LLMs)通常表现出较强的多语言能力。然而,这些模型的多语言性能在许多语言上的表现仍不明确,且缺乏全面的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览