主要观点总结
OpenAI新推出的GPT-4o模型集成了图像生成功能,正式向用户开放。该功能在Sora平台同步启用。该模型能够实现多种功能特性,包括主体关系控制、多视图生成、精准轮廓的风格迁移等。一句话总结就是超精准的指令遵循以及自主生成部分的可靠性。OpenAI的CEO表示此举将开启创作自由的新高峰。为了测试该模型的能力,知危编辑部做了一个深度测评,用Sora生成了一个中世纪RPG游戏的概念设计。实测表明,GPT-4o画图的前后一致性非常惊人。但也存在一些问题,如汉字生成有些问题,对非拉丁文字的生成还不擅长等。总体而言,GPT-4o为创作者打开了一扇通向想象的大门,是一个令人兴奋的起点。
关键观点总结
关键观点1: GPT-4o模型集成了图像生成功能,正式向用户开放。
该功能在Sora平台同步启用,并且Plus用户几乎没有使用次数限制。
关键观点2: GPT-4o模型的功能特性包括主体关系控制、多视图生成、精准轮廓的风格迁移等。
这些功能使得模型能够生成多种风格的图像,并且保持一致性。
关键观点3: OpenAI的CEO表示GPT-4o将开启创作自由的新高峰。
为了测试这一说法,知危编辑部做了一个深度测评,用Sora生成了一个中世纪RPG游戏的概念设计,展示了GPT-4o的能力。
关键观点4: GPT-4o在画图方面表现出色,前后一致性惊人。
但在某些方面存在问题,如汉字生成、对非拉丁文字的生成等还有待提高。
文章预览
上周 ( 3 月 26 日 ) ,OpenAI 突然来了一个更新,将 GPT-4o 模型集成了图像生成功能,正式向 ChatGPT 的 Plus、Pro、Team 及免费用户开放。同时,该功能在 Sora 平台也已同步启用。经测试, Plus 用户几乎没有使用次数限制 , 在 Sora 上可以最多单次生成 4 张图片,体验更好。 ( 由于访问量过大,现在已经限制为两张 ) 观察各种测试案例,可以发现 GPT-4o 能够实现多种神奇的功能或特性,包括主体关系控制、多视图生成、精准轮廓的风格迁移、知识理解能力、多轮对话编辑能力、多元素的一致稳定性控制、复杂文字嵌入和排版等。 实际上, 一句话总结就是超精准的指令遵循,以及自主生成部分的可靠性。 OpenAI 的 CEO Sam Altman 表示此举将开启创作自由的新高峰。 如果没有深度融入创作者的工作流中,创作自由不过是随口说说,所以目前网上零散的案
………………………………