刚刚，OpenAI发布GPT-4.1！全系支持百万token上下文，全方位碾压GPT-4o并且价格更低

机器之心 · 公众号 · AI · 2025-04-15 07:19

主要观点总结

OpenAI发布了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。新模型在编程、指令遵循、长上下文等方面有显著提升，成本更低，延迟更少。GPT-4.1在SWE-bench Verified测试、MultiChallenge基准测试、Video-MME等基准测试中表现优异。此外，新模型在长上下文理解方面也有突破，能够处理高达100万个上下文token。OpenAI还发布了新的评估方法OpenAI-MRCR和Graphwalks，以测试模型在长上下文用例中的性能。GPT-4.1系列模型在图像理解方面同样强大。

关键观点总结

关键观点1: GPT-4.1系列模型的发布

OpenAI发布了包含GPT-4.1、GPT-4.1 mini和GPT-4.1 nano的新模型系列，通过API调用向所有开发者开放。

关键观点2: 模型性能的提升

GPT-4.1系列模型在编程、指令遵循、长上下文等方面有显著提升，性能全面超越GPT-4o和GPT-4.o mini。

关键观点3: 成本降低和延迟减少

GPT-4.1系列模型提供卓越的性能，同时成本和延迟更低，为开发者提供更具吸引力的选项。

关键观点4: 基准测试成绩优异

GPT-4.1在多个基准测试中表现优异，如SWE-bench Verified测试、MultiChallenge基准测试、Video-MME等。

关键观点5: 长上下文理解的突破

GPT-4.1系列模型能够处理高达100万个上下文token，突破长上下文理解的限制。

关键观点6: 图像理解的强大能力

GPT-4.1系列模型在图像理解方面同样强大，尤其是GPT-4.1 mini在图像基准测试中经常击败GPT-4o。

文章预览

机器之心报道编辑：杜伟今天凌晨，OpenAI 的新系列模型 GPT-4.1 如约而至。该系列包含了三个模型，分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，它们仅通过 API 调用，并已向所有开发者开放。随着该系列模型在很多关键功能上提供了类似或更强的性能，并且成本和延迟更低，因此 OpenAI 将开始在 API 中弃用 GPT-4.5 预览版。弃用时间为三个月后（2025 年 7 月 14 日），从而为开发者提供时间过渡。 OpenAI 表示，这三个模型的性能全面超越了 GPT-4o 和 GPT-4o mini，并在编程和指令遵循方面均有显著提升。它们还拥有更大的上下文窗口 —— 支持高达 100 万个上下文 token ，并且能够通过改进的长上下文理解更好地利用这些上下文。知识截止日期已更新至 2024 年 6 月。总的来说，GPT-4.1 在以下行业标准指标上表现出色：编程：GPT-4.1 在 SWE-bench Verified 测试中得 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博