专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

OpenAI直播狙击谷歌，奥特曼AGI梗图现场直出！GPT-4o超强原生生图来袭

新智元 · 公众号 · AI · 2025-03-26 05:52

主要观点总结

OpenAI推出GPT-4o原生图像生成功能，演示了多种图像生成功能，包括制作梗图、文本渲染、多轮交互生成和指令遵循等。新功能能够准确遵循复杂提示，注重细节，结合世界知识生成图像。通过与文本联合分布训练和后训练优化，模型展现出强大的视觉表现力。

关键观点总结

关键观点1: GPT-4o原生图像生成功能介绍

OpenAI推出GPT-4o的图像生成功能，展示了多种图像生成能力，包括制作梗图、转换图像风格等。

关键观点2: GPT-4o的图像生成能力

GPT-4o不仅能理解图像与语言的关系，还能知道它们之间的相互关系，展现出惊人的视觉表现力。其具备文本渲染、多轮交互生成、指令遵循等特点。

关键观点3: GPT-4o的图像生成与上下文学习

GPT-4o能够分析并学习用户上传的图像，将其无缝整合到上下文中，用于辅助图像生成。其还具备世界知识，能连接文本和图像之间的知识，表现得更智能、更高效。

文章预览

新智元报道编辑：Aeneas 好困【新智元导读】刚刚，OpenAI深夜直播，GPT-4o的原生图像生成大升级！奥特曼亲自上阵组队，演示了自拍变梗图、相对论漫画等功能，不过相对隔壁谷歌发布的新模型，OpenAI的这波动作着实有点不够看。就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久，OpenAI也有动作了。奥特曼亲自带队，展示了GPT-4o图像生成技术的各种大升级，比如制作梗图、文本渲染、多轮交互生成和指令遵循等。整个直播中最亮的演示，莫过于这张官方玩梗的表情包了。目前，这项功能已经在ChatGPT和Sora中，向所有Plus、Pro、Team和免费用户推出。当然，新版Sora生图的时间，也比以往更长了。但OpenAI看来，生图的质量和其具备的世界知识，让用户值得等待那多出的几秒。 GPT-4o原生图像生成来了！在直播中，奥特曼介绍道，从今天起，ChatGPT中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博