专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型

机器之心  · 公众号  · AI  · 2024-07-17 12:04
    

文章预览

机器之心报道 机器之心编辑部 网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。 昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。 这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。 对于数字以及复杂的数学问题,专用模型更术业有专攻。 今天,法国大模型独角兽 Mistral AI 发布了一个 专注于数学推理和科学发现的7B大模型「Mathstral」 ,来解决需要复杂、多步骤逻辑推理的高级数学问题。 该模型基于 Mistral 7B 构建,支持的上下文窗口长度为32k,遵循的开源协议为Apache 2.0 license。 Mathstral在构建时追求出色的性能与速度权衡,这是 Mistral AI积极推广的一种开发理念,尤其是微调功能。 同时,Mathstral是一个指令型模型,可以使用它或 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览