今天看啥  ›  专栏  ›  Hugging Face

社区供稿 | Jina CLIP: 你的 CLIP 模型也可以是强大的文本检索器

Hugging Face  · 公众号  ·  · 2024-06-13 10:00
    

文章预览

CLIP 模型架起了文本和图像的桥梁,但实际上很少有人会用它来进行文本检索,因为 CLIP 的文本编码器无法有效的对长文本进行语义建模。 为了解决这一问题,我们推出了 Jina CLIP v1,一个增强版的 OpenAI CLIP 模型,擅长文本-文本、文本-图像、图像-文本、图像-图像四个方向的检索。从现在起,你的 CLIP 模型不仅是图像检索器,更是强大的文本检索器。 在构建多模态 RAG 应用时,你不再需要在不同的向量模型之间切换, 一个模型、两种模态、四个搜索方向  都交给 Jina CLIP v1。更关键的是,它还能够处理长达 8K 的输入长度。接下来,就让我们一探这款新模型的精华所在。 示例:用 Jina CLIP 实现零样本实时图像分类 CLIP 模型架构 在 2021 年 1 月,OpenAI 推出了开创性的 CLIP 模型,其架构简洁却极具巧思:将一个文本编码器与一个图像编码器结合,在统一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览