连接人工智能技术人才和产业人才的交流平台
今天看啥  ›  专栏  ›  机器学习研究组订阅

开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启

机器学习研究组订阅  · 公众号  · AI  · 2024-10-23 20:22

主要观点总结

法国AI初创公司推出的轻量级边缘模型Ministral 3B和Ministral 8B在性能上超越了其他模型,成为世界上最好的边缘模型之一。两款模型在知识、常识、推理、函数调用等方面表现出色,支持高达128k上下文,并配备了滑动窗口注意机制以实现更快和内存高效的推理。它们可以微调到各种用例中,包括管理复杂的AI智能体工作流和创建任务助手。尽管面临开源模式的争议和收费模式的转变,但Ministral 3B和Ministral 8B的出色性能仍然引起了广泛关注。

关键观点总结

关键观点1: Ministral 3B和Ministral 8B的性能超越其他模型,成为世界上最好的边缘模型之一。

这两款模型在知识、常识、推理、函数调用等方面表现出色,特别是在指令跟随基准上完全超越了Llama 3 8B和前辈模型Mistral 7B。

关键观点2: Ministral 3B和Ministral 8B支持高达128k上下文,并配备了滑动窗口注意机制。

这两款模型能够实现更快和内存高效的推理,适用于复杂的AI智能体工作流和任务助手的创建。

关键观点3: 法国AI初创公司的模型面临开源模式的争议和收费模式的转变。

尽管有争议和收费模式的改变,但Ministral 3B和Ministral 8B的出色性能仍然受到广泛关注。对于一些初创公司来说,持续打造优秀模型的同时,也需要考虑如何平衡开源与商业化的关系。


文章预览

Mistral 7B仅仅发布一周年,法国AI初创小模型「les Ministraux」就打败它了。 它堪称是,世界上最好的边缘模型。 Ministral 3B和Ministral 8B这两款轻量级模型,专为边缘设备打造。 截至目前,它们正式加入Mixtral、Pixtral、Codestral、Mathstral行列,成为Mistral一员。 别看仅有30亿参数,在指令跟随基准上,完全超越了Llama 3 8B,以及前辈模型Mistral 7B。 而且Ministral 3B和Ministral 8B在大模型竞技场中的测试,均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。 世界上最好的边缘模型 Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32k)。 在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。 而且,Ministral 8B还有配备了滑动窗口注意机制(sliding-window attention),以实现更快和内存高效的推理。 不论是管理复杂的AI智能体工作流,还是创建 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览