专栏名称: Hugging Face
The AI community building the future.
今天看啥  ›  专栏  ›  Hugging Face

欢迎 PaliGemma 2 – 来自 Google 的新视觉语言模型

Hugging Face  · 公众号  ·  · 2024-12-18 10:30
    

文章预览

我们很高兴迎来 Google 全新的视觉语言模型 PaliGemma 2 ,这是 PaliGemma 的一个新版本。与其前代产品一样,PaliGemma 2 使用强大的 SigLIP 进行视觉处理,但在文本解码部分升级到了最新的 Gemma 2 。 https://hf.co/collections/google/siglip-659d5e62f0ae1a57ae0e83ba 模型规模和输入分辨率 PaliGemma 2 提供了新的预训练模型,参数规模包括 3B 、 10B 和 28B 。所有模型均支持以下多种输入分辨率: 224x224 448x448 896x896 这种多样化的组合为不同的使用场景提供了极大的灵活性,使实践者能够根据质量和效率需求之间的平衡进行选择。与之相比,上一代 PaliGemma 仅提供 3B 版本。 预训练和微调能力 这些预训练模型被设计为更容易适配下游任务。首个 PaliGemma 模型因其广泛适配性被社区用于多种任务。本次迭代引入了更高质量的预训练模型和更多选择,进一步增强了灵活性。 DOCQI 数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览