文章预览
GPT‑4.1强在: 1.最强编码:GPT‑4.1在SWE-bench Verified上的得分为54.6%,比GPT‑4o提高了21.4%。 2.指令跟随:在Scale的MultiChallenge上,GPT‑4.1的得分为38.3%,比GPT‑4o提高了10.5%。 3.长上下文:在Video-MME上,GPT‑4.1取得了新的SOTA——在长视频、无字幕类别中得分72.0%,比GPT‑4o提高了6.7%。 详见:https://openai.com/index/gpt-4-1/
………………………………