专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
今天看啥  ›  专栏  ›  AI前线

GPT-4.1登场,实测碾压OpenAI所有模型,但效果不如Gemini?

AI前线  · 公众号  · AI  · 2025-04-15 11:51
    

主要观点总结

OpenAI推出了名为GPT-4.1的新模型,该系列主要提升了编码能力和指令跟随能力,并扩展了上下文窗口。包括标准版、mini版和nano版,可通过API使用,不能用于ChatGPT。网友试用后评价不一,有的在收益报告文档处理方面表现出色,有的在编码基准测试中不如其他模型。OpenAI还宣布将在7月14日之前淘汰GPT-4.5。

关键观点总结

关键观点1: GPT-4.1系列模型的特点和推出

OpenAI推出了GPT-4.1模型系列,包括标准版、mini版和nano版。主要提升了编码能力和指令跟随能力,扩展了上下文窗口至100万个tokens。知识截止日期为2024年6月。

关键观点2: GPT-4.1与其他模型的比较

有网友将GPT-4.1与其他模型如Gemini 2.5 Pro、LLama 4等进行了比较。在上下文理解和长视频理解测试中,GPT-4.1表现出了一定的优势,但在某些编码基准测试中表现略逊于其他模型。

关键观点3: GPT-4.1的应用场景

GPT-4.1被用于处理收益报告文档等实际场景,表现出能够大规模查询、整合、分析和总结任何数据类型的能力。

关键观点4: 关于GPT-4.5的淘汰和网友的调侃

OpenAI宣布将在7月14日之前从API访问中淘汰GPT-4.5。对此有网友表示,在某些测试中GPT-4.5的表现仍优于GPT-4.1。


文章预览

昨晚,OpenAI 推出了名为 GPT-4.1 的新模型,该系列优先提升了编码能力和指令跟随能力,同时将上下文窗口扩展到了100万个tokens,大约相当于75万个单词。所有这些模型的知识截止日期为2024年6月,能提供更贴合当下的上下文理解。 该系列包括标准的GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,所有版本都可以通过API使用,但无法在ChatGPT中使用。 目前,已经有不少用户在体验GPT-4.1的效果了。一位网友在试用后表示,“GPT-4.1可以处理所有其他OpenAI模型无法应对的大篇幅上下文。”还有网友用GPT-4.1模型绘制一只鹈鹕,并将其与Grok 3、LLama 4 和 Gemini 2.5 Pro 的生成结果进行比较,被评Gemini做得更好。 Box AI则分享了用GPT-4.1模型来研读一份冗长的收益报告文档、从中提取出数据字段的例子,并表示其“能够大规模查询、整合、分析和总结任何数据类型”。 此外,GPT 4.1现已 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览