GPT-4.1登场，实测碾压OpenAI所有模型，但效果不如Gemini？

AI前线 · 公众号 · AI · 2025-04-15 11:51

主要观点总结

OpenAI推出了名为GPT-4.1的新模型，该系列主要提升了编码能力和指令跟随能力，并扩展了上下文窗口。包括标准版、mini版和nano版，可通过API使用，不能用于ChatGPT。网友试用后评价不一，有的在收益报告文档处理方面表现出色，有的在编码基准测试中不如其他模型。OpenAI还宣布将在7月14日之前淘汰GPT-4.5。

关键观点总结

关键观点1: GPT-4.1系列模型的特点和推出

OpenAI推出了GPT-4.1模型系列，包括标准版、mini版和nano版。主要提升了编码能力和指令跟随能力，扩展了上下文窗口至100万个tokens。知识截止日期为2024年6月。

关键观点2: GPT-4.1与其他模型的比较

有网友将GPT-4.1与其他模型如Gemini 2.5 Pro、LLama 4等进行了比较。在上下文理解和长视频理解测试中，GPT-4.1表现出了一定的优势，但在某些编码基准测试中表现略逊于其他模型。

关键观点3: GPT-4.1的应用场景

GPT-4.1被用于处理收益报告文档等实际场景，表现出能够大规模查询、整合、分析和总结任何数据类型的能力。

关键观点4: 关于GPT-4.5的淘汰和网友的调侃

OpenAI宣布将在7月14日之前从API访问中淘汰GPT-4.5。对此有网友表示，在某些测试中GPT-4.5的表现仍优于GPT-4.1。

文章预览

昨晚，OpenAI 推出了名为 GPT-4.1 的新模型，该系列优先提升了编码能力和指令跟随能力，同时将上下文窗口扩展到了100万个tokens，大约相当于75万个单词。所有这些模型的知识截止日期为2024年6月，能提供更贴合当下的上下文理解。该系列包括标准的GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，所有版本都可以通过API使用，但无法在ChatGPT中使用。目前，已经有不少用户在体验GPT-4.1的效果了。一位网友在试用后表示，“GPT-4.1可以处理所有其他OpenAI模型无法应对的大篇幅上下文。”还有网友用GPT-4.1模型绘制一只鹈鹕，并将其与Grok 3、LLama 4 和 Gemini 2.5 Pro 的生成结果进行比较，被评Gemini做得更好。 Box AI则分享了用GPT-4.1模型来研读一份冗长的收益报告文档、从中提取出数据字段的例子，并表示其“能够大规模查询、整合、分析和总结任何数据类型”。此外，GPT 4.1现已 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博