专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

Hugging Face发布SmolVLM-256M与SmolV-20250125174610

黄建同学  · 微博  · AI  · 2025-01-25 17:46
    

文章预览

2025-01-25 17:46 本条微博链接 Hugging Face发布SmolVLM-256M与SmolVLM-500M:其中256M是目前全球最小的视觉语言模型(VLM)! 1. SmolVLM-256M 全球最小的视觉语言模型,仅256M参数。 在多模态任务中表现强劲,涵盖图片描述、文档问答和基本视觉推理等任务。 2. SmolVLM-500M 更强性能的升级版本,仍保持轻量化设计。 在DocVQA和MMMU等任务中表现出色,更适合生产环境的直接部署。 3. 轻量化与高效性能 使用更小的SigLIP视觉编码器(93M参数), ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览