专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

7B新王登基！Zamba 2完胜同级模型，推理效率比Llama 3提升20%，内存用量更少

新智元 · 公众号 · AI · 2024-10-24 18:40

文章预览

新智元报道编辑：LRS 【新智元导读】 Zamba2-7B是一款小型语言模型，在保持输出质量的同时，通过创新架构实现了比同类模型更快的推理速度和更低的内存占用，在图像描述等任务上表现出色，能在各种边缘设备和消费级GPU上高效运行。除了不断增加语言模型的尺寸来提升性能外，小语言模型（SLM）赛道也是越来越卷，研究人员在保证输出质量尽量不变的情况下，不断降低模型尺寸，减少内存占用量，提升推理效率，从而能够在各种边缘计算设备和消费级GPU上部署使用。最近，Zyphra发布Zamba2-7B模型，在质量和性能上都优于Mistral、Google的Gemma和Meta的Llama3系列同尺寸小语言模型；在推理效率上，与 Llama3-8B 等模型相比，第一个token的时间缩短了 25%，每秒token数量提高了 20%，并且内存使用量显着减少。 Instruct下载链接：https://huggingface.co/Zyphra/Za ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · //@马少平THU:好精彩//@刘群MT-to-Death:编都-20241122070908

昨天

黄建同学 · 玩转AI游戏开发！#ai##科技# DeepLearning A-20241121183241

2 天前

黄建同学 · Suno v4 🔥正式发布↓ #ai##音乐# 且通过了**图-20241120093850

3 天前

机器之心 · 高通的自研架构芯片，正在整合生成式AI世界

4 天前

宝玉xp · //@梁斌penny://@真阿蛇://@徐林:哈哈哈哈，好好玩-20241118013050

5 天前

四川大学本科招生 · 手搓赛车飞机、机器人跳舞、文科生上工科课……看川大课程进化到啥程度了！

1 周前

四川大学本科招生 · 手搓赛车飞机、机器人跳舞、文科生上工科课……看川大课程进化到啥程度了！

1 周前