文章预览
还在为多语言的文本向量发愁?担心模型太大跑不动? Jina Embeddings V3 来了,这款 5.7 亿参数的顶级文本向量模型, 在多语言和长文本检索任务上达到当前最佳水平 SOTA 。内置多种 LoRA 适配器,可以根据你的需求,针对 检索、聚类、分类和匹配 的不同场景进行定制,获得更精准的向量化效果。 多语言支持 : 支持 89 种语言,全面超越 multilingual-e5-large-instruct 长文本处理 : 支持 8192 token 的输入长度,在 LongEmbed 基准测试中表现出色 任务定制更精准 : 内置多种 LoRA 适配器,针对检索、聚类、分类和匹配等任务,生成定制化向量,效果更精准。 输出维度可定制 : 默认输出维度为 1024,但你完全可以根据需要把它缩减到 32,性能几乎不受影响,这都归功于俄罗斯套娃表示学习技术的加持。 模型已开源,即刻体验: 开源模型链接: https://huggingface.co/jinaai/jina-e
………………………………