专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

NV-Embed: 不装了,NVIDIA亲自下场,发布自家embedding模型并成功登顶MTEB

AINLP  · 公众号  ·  · 2024-06-11 10:10
    

文章预览

提纲 1 简介 ‍ ‍ ‍ ‍ 2 NV-Embed     2.1 模型结构     2.2 模型训练 3 实验结果 4 讨论 参考文献 ‍ ‍ 1 简介     上个月MTEB的榜首再次又换人了,NVIDIA亲自下场,发布了自己的embedding模型NV-Embed,成功占据榜首之位。芯片公司不好好做芯片,亲自下场做模型了,来给大家压力了。 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍     NV-Embed移除了Decoder-only模型结构中的单向mask机制,并添加了一个后置模块latent attention layer用于进一步提升embedding的表征能力,加上其特有的训练流程设计,最终在诸多评测任务上表现出色。 ‍‍‍‍‍‍‍‍‍‍ 图1:MTEB榜单截图 ‍ ‍ 2 NV-Embed ‍ ‍ ‍ ‍ ‍ ‍ ‍ ‍ 2.1 模型结构 相比于传统的Decoder-only语言模型,NV-Embed做了以下几个调整。     a) 移除了单向mask机制,改单向注意力机制为 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览