GPT-4.1深夜登场，中科大校友领队 |【经纬低调分享】

经纬创投 · 公众号 · 科技投资 · 2025-04-15 12:05

主要观点总结

OpenAI发布了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程、指令跟随、长上下文处理能力等方面实现了重大突破。其中，GPT-4.1在SWE-bench Verified上的得分达到54.6%，长上下文处理能力也有显著提升，能够处理最多100万Token的上下文。此外，GPT-4.1系列模型由中科大校友Jiahui Yu领衔开发，他在深度学习和高性能计算领域有丰富的研究经验。

关键观点总结

关键观点1: GPT-4.1系列模型发布

OpenAI推出了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，这些模型在编程、指令跟随和长上下文处理能力等方面取得了显著进展。

关键观点2: 模型的技术突破

GPT-4.1系列模型在多项基准测试中表现出色，如SWE-bench Verified、Aider多语言编码基准等，展现了强大的编程能力和指令跟随能力。

关键观点3: 长上下文处理能力的提升

GPT-4.1系列模型能够处理长达100万Token的上下文，并且在长上下文任务中表现出色，如OpenAI-MRCR和Graphwalks基准测试。

关键观点4: 视觉理解的增强

GPT-4.1系列模型在图像理解方面表现出色，特别是在MathVista和CharXiv-Reasoning等基准测试中优于GPT-4o。

关键观点5: 领导团队和开发者

GPT-4.1系列模型由中科大校友Jiahui Yu领衔开发，他在深度学习和高性能计算领域拥有丰富的研究经验，此前曾在Google DeepMind等多个机构实习。

文章预览

2025年4月15日，OpenA发布GPT-4.1系列模型，这一系列模型在编程、指令跟随和长上下文处理能力上实现了全面飞跃，标志着自然语言处理技术的又一次重大突破。 GPT-4.1系列包括三个版本：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型均支持最高100万Token的超大上下文窗口，远超前代模型的12.8万Token，极大地提升了处理复杂任务的能力。其中，GPT-4.1 nano作为OpenAI首款nano模型，以最小、最快、最便宜的姿态强势登场，其性能在多项基准测试中完胜GPT-4o mini，展现出极高的性价比。 GPT-4.1系列的推出也意味着GPT-4.5将在三个月后停用。OpenAI表示，GPT-4.5原本作为研究预览版推出，目的是探索大规模、计算密集型的LLM。虽然即将下架，但其具备的创造力、写作质量和幽默感等特点将被融入未来的API模型中。 GPT-4.1系列的开发由中科大校友Jiahui Yu领衔，他曾在Google DeepMind ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博