2GB 内存就能跑 ChatGPT！这个国产「小钢炮」，要让华为 OV 们的 AI 体验突破瓶颈

APPSO · 公众号 · app · 2024-09-05 22:12

主要观点总结

本文主要介绍了面壁智能发布的端侧大模型MiniCPM 3.0的特点和优势。MiniCPM 3.0具备无限长文本处理、高性能的上下文长度处理、端侧最强函数调用性能等特点，并且拥有RAG外挂三件套，能够在多个任务上表现优异。此外，MiniCPM 3.0对端侧设备的资源需求低，具备弱网、断网可用、超低时延、数据隐私安全等本地优势。面壁智能通过不断将高效高性能大模型放到离用户最近的地方，让大模型的能力像电力一样被随意调用、无处不在、普适且安全。

关键观点总结

关键观点1: MiniCPM 3.0的特点和优势

具备无限长文本处理、高性能的上下文长度处理、端侧最强函数调用性能；拥有RAG外挂三件套，能够在多个任务上表现优异；对端侧设备的资源需求低，具备弱网、断网可用、超低时延、数据隐私安全等本地优势。

关键观点2: 面壁智能的摩尔定律

面壁智能首席科学家提出的大模型时代的摩尔定律表明，大模型的知识密度平均每8个月提升一倍。随着模型知识密度的增强，大模型的能力将不断提升。

关键观点3: 面壁智能的应用落地情况

面壁智能一直在探索落地应用的场景，面壁小钢炮MiniCPM端侧模型已经在PC、平板、手机等领域上实际运行。此外，面壁智能也在WAIC上联手打造完整具身智能的先驱方案。预计将有配备面壁智能端侧模型的产品在年底前上市。

文章预览

在这波 AI 浪潮中，面壁智能是国内少有选择 All In 端侧模型的头部大模型厂商。自从面壁智能 2 月份发布小钢炮 1.0 后，接连数月不断迭代升级，其中后续推出的开源模型 MiniCPM-Llama3-V 2.5 更是因为过硬的实力遭到了斯坦福 AI 团队的抄袭。四月份，面壁智能 CTO 曾国洋还曾预言，GPT-3.5 级别的模型将在一两年内就能在移动设备上运行。好消息是，不用再等一到两年了，因为今天发布的 MiniCPM 3.0 实现了初代小钢炮发布时立下的 Flag：今年内让 GPT-3.5 水平的模型在端侧跑起来。仅 4B 参数，以小博大，性能超越 GPT-3.5，MiniCPM 3.0 也标志着「端侧 ChatGPT」时刻的到来。简单来说就是，MiniCPM 3.0 的面世意味着用户未来能体验到快速、安全、且功能丰富的本地 AI 服务，获得更流畅的交互体验。基准测试显示，MiniCPM 3.0 在 CMMLU、CEVAL 等考究中文能力的基准测试 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博