专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ICLR 2025 多语言大模型相关论文速览

AINLP · 公众号 · · 2024-11-23 21:40

文章预览

© 作者｜罗文扬机构｜中国人民大学研究方向｜大语言模型 Dataset and benchmark MMTEB: Massive Multilingual Text Embedding Benchmark 文本嵌入通常仅在有限的任务集上进行评估，这些任务在语言、领域和任务类型上都较为单一。为了突破这一限制并提供更全面的评估，我们提出了大规模多语言文本嵌入基准（MMTEB）。这是一个由社区驱动的大规模扩展项目，将MTEB扩展到超过500个质量受控的评估任务，涵盖超过1,000种语言。MMTEB包含了一系列具有挑战性的全新任务，例如指令跟随、长文档检索和代码检索，成为迄今为止针对嵌入模型的最大多语言评估任务集合。 Mexa: Multilingual Evaluation of English-Centric LLMs via Cross-Lingual Alignment 英语为中心的大语言模型（LLMs）通常表现出较强的多语言能力。然而，这些模型的多语言性能在许多语言上的表现仍不明确，且缺乏全面的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Insight数据库 · 2024 年全球新药临床进展比拼！恒瑞夺冠，中国生物制药跻身前五

昨天

药渡 · 银屑病潜在新兴疗法：多肽药物能否开辟“第三战场”？

昨天

丁香园用药指南 · 值班遇到心衰，除了「新四联」，还需要知道「五朵金花」

2 天前

大庆晚报 · 理性购买！事关保健食品→

2 天前

大庆晚报 · 理性购买！事关保健食品→

2 天前

VR陀螺 · PICO应用商店将向所有开发者无门槛开放，向更开放的开发者生态迈进

6 月前

情报姬 · 为了逃出屎山代码的限制，高清重制客户端正成为老网游们的新宠

6 月前

游戏茶馆 · 《仙剑》单机新作始动，姚仙规划了两个开发方向

4 周前