专栏名称: Coggle数据科学
Coggle全称Communication For Kaggle,专注数据科学领域竞赛相关资讯分享。
目录
相关文章推荐
APPSO  ·  OpenAI ... ·  3 天前  
今天看啥  ›  专栏  ›  Coggle数据科学

嵌入评测榜单新SOTA:来自英伟达的大模型编码模型 NV-Embed

Coggle数据科学  · 公众号  ·  · 2024-06-04 14:41
    

文章预览

基于解码器的大型语言模型(LLM)嵌入模型在通用文本嵌入任务中(包括密集向量检索)逐渐超越了基于BERT或T5的嵌入模型。在这项工作中,我们介绍了NV-Embed模型,该模型通过多种架构设计和训练程序显著增强了LLM作为通用嵌入模型的性能,同时保持了其简单性和可复现性。 NV-Embed模型仅使用公开数据,取得了69.32的创纪录高分(截至2024年5月24日),在大规模文本嵌入基准测试(MTEB)中排名第一, 涵盖了56项任务,包括检索、重排序、分类、聚类和语义文本相似性任务。 https://arxiv.org/pdf/2405.17428 https://huggingface.co/nvidia/NV-Embed-v1 unset unset 文本嵌入模型 unset unset 双向嵌入模型 基于BERT或T5的嵌入模型长期以来一直是通用嵌入任务的主导方法。早期的例子包括Sentence-BERT和SimCSE,它们在自然语言推理(NLI)数据集上对BERT进行了微调。 嵌入模型首先从预 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览