注册登录

专栏名称: CVHub

门头沟学院AI视觉实验室御用公众号 | 学术 | 科研 | 就业

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

目录

相关文章推荐

彬彬有理 · 她居然被嘲老了丑了，不配当“小三”了？ · 16 小时前

女神汇 · 女朋友瞒着我去三亚旅游了，她是不是出轨了？ · 2 天前

女神汇 · 男朋友给了我20万，闺蜜却劝我拿这钱去隆胸？ ... · 4 天前

今天看啥 › 专栏 › CVHub

微信团队发布全新多模态大模型 POINTS: 简单高效又不失性能

CVHub · 公众号 · · 2024-10-16 23:19

文章预览

论文地址：https://arxiv.org/pdf/2409.04828 论文源码：https://github.com/WePOINTS/WePOINTS 项目主页：https://huggingface.co/papers/2409.04828 导读 2022年11月30日，OpenAI推出了ChatGPT，最初仅是在业界的小范围内引起了关注。几个月后，GPT-4.0的发布彻底点燃了整个行业并从此进入了普罗大众的视野。经过一年的发展，大家逐渐意识到单纯的LLM已无法满足需求，这一点从各大厂商和顶尖科研机构发布的成果中可以看出，人工智能正朝着VLM的方向发展。今年，各路大神纷纷亮出自家的视觉语言模型，仿佛一场科技界的选美大赛。首当其冲的便是著名的闭源明星选手如 GPT-4、Gemini Pro 1.5和Claude 3 等模型，其成功将 LLM 扩展到视觉语言模型领域。而 LLaVA、QwenVL、InternVL 等开源届的代表新秀也不甘示弱，各方面能力也在不断赶超、逼近甚至部分超越闭源模型。然而，这场视觉AI的狂 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

彬彬有理 · 她居然被嘲老了丑了，不配当“小三”了？

16 小时前

女神汇 · 女朋友瞒着我去三亚旅游了，她是不是出轨了？

2 天前

女神汇 · 男朋友给了我20万，闺蜜却劝我拿这钱去隆胸？我该怎么办？

4 天前

光大证券研究 · 【钢铁】LME期铜和伦敦金现价格均创历史新高，取向硅钢周价再涨4%——金属周期品高频数据周报（王招华/戴默）

11 月前

交易圈 · 招聘 | 华西证券固定收益部招聘策略研究员、投资经理

4 月前

龚新宇聊楼市 · 优享家真诚的买房服务介绍

2 月前

云南气象 · 周末云南大部天气晴朗冷空气“袭扰”东部地区

3 周前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号