专栏名称: NLP工作站

AIGC前沿知识分享&落地经验总结

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

新晚报 · 接吻时长世界纪录保持者夫妇分手，曾连续吻了…… · 9 小时前

金色旋风 · 翻译国外书，涨粉8000，卖888一份 · 22 小时前

现代快报 · “月薪5000别吃火锅”？最新回应 · 昨天

新晚报 · 冰城请柬梅开二度 ... · 2 天前

姑苏晚报 · 突然宣布终止运营！很多苏州人都玩过…… · 3 天前

今天看啥 › 专栏 › NLP工作站

实测！最新端侧全模态大模型Megrez-3B-Omni

NLP工作站 · 公众号 · · 2024-12-16 16:56

文章预览

大家好，我是刘聪NLP。中午看到无问芯穹开源了一个端侧全模态大模型-Megrez-3B-Omni，马上来测测看，效果如何。 Github: https://github.com/infinigence/Infini-Megrez HF: https://huggingface.co/Infinigence/Megrez-3B-Omni Demo: https://huggingface.co/spaces/Infinigence/Megrez-3B-Omni 先说点题外话，大模型发展到现在，虽说参数越大，模型越智能，但毕竟现在GPU资源还是蛮紧张的，太大的模型消耗资源太多，并发起来的时候，根本烧不起，真正坐落地的懂得都懂。当然现在也是越来越多的人来搞SLMs（small language models），像千问最新的Qwen2.5系列也是开源了0.5B、1.5B、3B模型，面壁前端时间也是开源了MiniCPM3-4B模型，微软的Phi系列模型也是一直在更新。这也是AI现在冲突的点吧，模型越大越智能，模型越小越容易落地。一个全模态的端侧模型，相当于一个模型干3个事情，可以极大减少部署 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新晚报 · 接吻时长世界纪录保持者夫妇分手，曾连续吻了……

9 小时前

新晚报 · 接吻时长世界纪录保持者夫妇分手，曾连续吻了……

9 小时前

金色旋风 · 翻译国外书，涨粉8000，卖888一份

22 小时前

金色旋风 · 翻译国外书，涨粉8000，卖888一份

22 小时前

现代快报 · “月薪5000别吃火锅”？最新回应

昨天

现代快报 · “月薪5000别吃火锅”？最新回应

昨天

新晚报 · 冰城请柬梅开二度冰城礼物今天发出丨“春风有信再约尔滨”第二季启动

2 天前

新晚报 · 冰城请柬梅开二度冰城礼物今天发出丨“春风有信再约尔滨”第二季启动

2 天前

姑苏晚报 · 突然宣布终止运营！很多苏州人都玩过……

3 天前

姑苏晚报 · 突然宣布终止运营！很多苏州人都玩过……

3 天前

走出去情报 · 如何制定国际化战略？

6 月前

湖南日报 · 冲上热搜！68岁赵本山，突传消息

3 周前

网信江苏 · 3月1日起，开始退钱！

2 周前

大江网 · 突然爆发！飙涨！

6 天前