专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi...

夕小瑶科技说  · 公众号  ·  · 2024-09-05 21:54

主要观点总结

面壁智能发布新一代基座模型面壁小钢炮 MiniCPM 3.0,以4B参数实现超越GPT-3.5的性能。该模型在包括自然语言理解、知识、代码、数学等多项能力上实现赶超,展现强大的综合性能。其特点包括无限长文本处理能力、强大的Function calling性能和RAG外挂三件套等。

关键观点总结

关键观点1: 面壁智能发布新一代基座模型MiniCPM 3.0

该模型实现了超越GPT-3.5的性能,具有强大的综合性能,包括自然语言理解、知识、代码、数学等多项能力。

关键观点2: 无限长文本处理能力

MiniCPM 3.0采用LLMxMapReduce长文本分帧处理技术,实现无限长文本的稳定拓展,展现出超越GPT-4和KimiChat等标杆模型的优异表现。

关键观点3: 强大的Function calling性能

MiniCPM 3.0拥有端侧最强的Function calling性能,在权威评测榜单Berkeley Function-Calling Leaderboard上表现优异。

关键观点4: RAG外挂三件套

MiniCPM 3.0配备了超强RAG外挂三件套,包括MiniCPM-Embedding(检索模型)、MiniCPM-Reranker(重排序模型)和面向RAG场景的LoRA插件(生成模型),在多项任务上表现超越Llama3-8B等业内优秀模型。

关键观点5: 面壁智能的科学化方法论和高效大模型趋势

面壁智能采用科学化的方法论构建大模型,致力于提高模型的知识密度,并通过不断的技术创新实现模型性能的提升。其愿景是将高效高性能大模型放到离用户最近的地方,让大模型的能力像电力一样被随意调用。


文章预览

杀疯了!杀疯了! 你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 ! OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司抢先了! 这家公司就是大模型端侧王者面壁智能,他们今天刚刚发布了新一代基座模型面壁小钢炮 MiniCPM 3.0 ,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能,强得不像个端侧模型。 新一代面壁小钢炮 MiniCPM 3.0 全面 掀翻了大模型牌桌! 它全面开挂,不仅综合性能强悍,还在其它业内呼声众多的方向都进行了一遍踢馆! 长文本方向 :它具有无限长文本,榜单性能超越 Kimi,超长文本也不崩; Function Calling方向 : 它的性能比肩 GPT-4o ,是端侧最强 ; RAG 方向 : 超强 RAG 外挂三件套,中文检索第一、生成超 Llama3-8B。 ➤  MiniCPM 3.0 开源地址: GitHub:🔗 https://github.com/OpenBMB/MiniCPM HuggingFace:🔗 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览