只给一张Doge图，GPT-4o就帮我画好一整个RPG游戏

知危 · 公众号 · 科技自媒体 · 2025-03-31 14:28

主要观点总结

OpenAI新推出的GPT-4o模型集成了图像生成功能，正式向用户开放。该功能在Sora平台同步启用。该模型能够实现多种功能特性，包括主体关系控制、多视图生成、精准轮廓的风格迁移等。一句话总结就是超精准的指令遵循以及自主生成部分的可靠性。OpenAI的CEO表示此举将开启创作自由的新高峰。为了测试该模型的能力，知危编辑部做了一个深度测评，用Sora生成了一个中世纪RPG游戏的概念设计。实测表明，GPT-4o画图的前后一致性非常惊人。但也存在一些问题，如汉字生成有些问题，对非拉丁文字的生成还不擅长等。总体而言，GPT-4o为创作者打开了一扇通向想象的大门，是一个令人兴奋的起点。

关键观点总结

关键观点1: GPT-4o模型集成了图像生成功能，正式向用户开放。

该功能在Sora平台同步启用，并且Plus用户几乎没有使用次数限制。

关键观点2: GPT-4o模型的功能特性包括主体关系控制、多视图生成、精准轮廓的风格迁移等。

这些功能使得模型能够生成多种风格的图像，并且保持一致性。

关键观点3: OpenAI的CEO表示GPT-4o将开启创作自由的新高峰。

为了测试这一说法，知危编辑部做了一个深度测评，用Sora生成了一个中世纪RPG游戏的概念设计，展示了GPT-4o的能力。

关键观点4: GPT-4o在画图方面表现出色，前后一致性惊人。

但在某些方面存在问题，如汉字生成、对非拉丁文字的生成等还有待提高。

文章预览

上周（ 3 月 26 日），OpenAI 突然来了一个更新，将 GPT-4o 模型集成了图像生成功能，正式向 ChatGPT 的 Plus、Pro、Team 及免费用户开放。同时，该功能在 Sora 平台也已同步启用。经测试， Plus 用户几乎没有使用次数限制，在 Sora 上可以最多单次生成 4 张图片，体验更好。（由于访问量过大，现在已经限制为两张）观察各种测试案例，可以发现 GPT-4o 能够实现多种神奇的功能或特性，包括主体关系控制、多视图生成、精准轮廓的风格迁移、知识理解能力、多轮对话编辑能力、多元素的一致稳定性控制、复杂文字嵌入和排版等。实际上，一句话总结就是超精准的指令遵循，以及自主生成部分的可靠性。 OpenAI 的 CEO Sam Altman 表示此举将开启创作自由的新高峰。如果没有深度融入创作者的工作流中，创作自由不过是随口说说，所以目前网上零散的案 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博