专栏名称: 知危
提供敏锐、独到的商业信息与参考,重点关注TMT、出海、新消费、新能源。
今天看啥  ›  专栏  ›  知危

只给一张Doge图,GPT-4o就帮我画好一整个RPG游戏

知危  · 公众号  · 科技自媒体  · 2025-03-31 14:28
    

主要观点总结

OpenAI新推出的GPT-4o模型集成了图像生成功能,正式向用户开放。该功能在Sora平台同步启用。该模型能够实现多种功能特性,包括主体关系控制、多视图生成、精准轮廓的风格迁移等。一句话总结就是超精准的指令遵循以及自主生成部分的可靠性。OpenAI的CEO表示此举将开启创作自由的新高峰。为了测试该模型的能力,知危编辑部做了一个深度测评,用Sora生成了一个中世纪RPG游戏的概念设计。实测表明,GPT-4o画图的前后一致性非常惊人。但也存在一些问题,如汉字生成有些问题,对非拉丁文字的生成还不擅长等。总体而言,GPT-4o为创作者打开了一扇通向想象的大门,是一个令人兴奋的起点。

关键观点总结

关键观点1: GPT-4o模型集成了图像生成功能,正式向用户开放。

该功能在Sora平台同步启用,并且Plus用户几乎没有使用次数限制。

关键观点2: GPT-4o模型的功能特性包括主体关系控制、多视图生成、精准轮廓的风格迁移等。

这些功能使得模型能够生成多种风格的图像,并且保持一致性。

关键观点3: OpenAI的CEO表示GPT-4o将开启创作自由的新高峰。

为了测试这一说法,知危编辑部做了一个深度测评,用Sora生成了一个中世纪RPG游戏的概念设计,展示了GPT-4o的能力。

关键观点4: GPT-4o在画图方面表现出色,前后一致性惊人。

但在某些方面存在问题,如汉字生成、对非拉丁文字的生成等还有待提高。


文章预览

上周 (  3 月 26 日 ) ,OpenAI 突然来了一个更新,将 GPT-4o 模型集成了图像生成功能,正式向 ChatGPT 的 Plus、Pro、Team 及免费用户开放。同时,该功能在 Sora 平台也已同步启用。经测试, Plus 用户几乎没有使用次数限制 , 在 Sora 上可以最多单次生成 4 张图片,体验更好。 ( 由于访问量过大,现在已经限制为两张  ) 观察各种测试案例,可以发现 GPT-4o 能够实现多种神奇的功能或特性,包括主体关系控制、多视图生成、精准轮廓的风格迁移、知识理解能力、多轮对话编辑能力、多元素的一致稳定性控制、复杂文字嵌入和排版等。 实际上, 一句话总结就是超精准的指令遵循,以及自主生成部分的可靠性。 OpenAI 的 CEO Sam Altman 表示此举将开启创作自由的新高峰。 如果没有深度融入创作者的工作流中,创作自由不过是随口说说,所以目前网上零散的案 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览