专栏名称: 夕小瑶科技说

这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货，有小夕的回忆与日常，还有最重要的：萌！气！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

4B小模型掀翻大模型牌桌！性能超GPT-3.5，无限长文本性能超Kimi...

夕小瑶科技说 · 公众号 · 科技自媒体 · 2024-09-05 21:54

主要观点总结

面壁智能发布新一代基座模型面壁小钢炮 MiniCPM 3.0，以4B参数实现超越GPT-3.5的性能。该模型在包括自然语言理解、知识、代码、数学等多项能力上实现赶超，展现强大的综合性能。其特点包括无限长文本处理能力、强大的Function calling性能和RAG外挂三件套等。

关键观点总结

关键观点1: 面壁智能发布新一代基座模型MiniCPM 3.0

该模型实现了超越GPT-3.5的性能，具有强大的综合性能，包括自然语言理解、知识、代码、数学等多项能力。

关键观点2: 无限长文本处理能力

MiniCPM 3.0采用LLMxMapReduce长文本分帧处理技术，实现无限长文本的稳定拓展，展现出超越GPT-4和KimiChat等标杆模型的优异表现。

关键观点3: 强大的Function calling性能

MiniCPM 3.0拥有端侧最强的Function calling性能，在权威评测榜单Berkeley Function-Calling Leaderboard上表现优异。

关键观点4: RAG外挂三件套

MiniCPM 3.0配备了超强RAG外挂三件套，包括MiniCPM-Embedding（检索模型）、MiniCPM-Reranker（重排序模型）和面向RAG场景的LoRA插件（生成模型），在多项任务上表现超越Llama3-8B等业内优秀模型。

关键观点5: 面壁智能的科学化方法论和高效大模型趋势

面壁智能采用科学化的方法论构建大模型，致力于提高模型的知识密度，并通过不断的技术创新实现模型性能的提升。其愿景是将高效高性能大模型放到离用户最近的地方，让大模型的能力像电力一样被随意调用。

文章预览

杀疯了！杀疯了！你敢相信 4B 参数小模型，性能却超越千亿量级的 GPT-3.5 ！ OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事，被一家中国大模型公司抢先了！这家公司就是大模型端侧王者面壁智能，他们今天刚刚发布了新一代基座模型面壁小钢炮 MiniCPM 3.0 ，再次以小博大，以 4B 参数，带来超越 GPT-3.5 的性能，强得不像个端侧模型。新一代面壁小钢炮 MiniCPM 3.0 全面掀翻了大模型牌桌！它全面开挂，不仅综合性能强悍，还在其它业内呼声众多的方向都进行了一遍踢馆！长文本方向：它具有无限长文本，榜单性能超越 Kimi，超长文本也不崩； Function Calling方向：它的性能比肩 GPT-4o ，是端侧最强； RAG 方向：超强 RAG 外挂三件套，中文检索第一、生成超 Llama3-8B。 ➤ MiniCPM 3.0 开源地址： GitHub:🔗 https://github.com/OpenBMB/MiniCPM HuggingFace:🔗 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

笔记侠 · 张一鸣重返中国首富：凡事，就怕不认真

昨天

上海环境 · 市生态环境局召开2025年全市扬尘在线监测质量管理工作部署会

昨天

上海环境 · 市生态环境局召开2025年全市扬尘在线监测质量管理工作部署会

昨天

李楠或kkk · 弄个 fanless AMD 395 主机放 mega 上再来个-20250325234253

2 天前

湖南工信 · 省工信厅组织开展“金种子杯”大学生创业大赛评委库入库专家征集工作

3 天前

湖南工信 · 省工信厅组织开展“金种子杯”大学生创业大赛评委库入库专家征集工作

3 天前

广东应急管理 · 部分地区森林火险等级极高！清明节临近，防火要注意→

3 天前

GameLook · 首发登顶iOS免费榜，自此SLG这方世界冲入“启元like”时代

8 月前

气象北京 · 多彩京秋丨全市彩叶树变色率播报（2024.10.20）

5 月前

新闻株洲 · 株洲经开区调区扩区获批！

2 月前

班主任家园 · 女生“全损课本”走红，自认为是清北的苗子，老师：自我感动罢了

5 天前