主要观点总结
本文主要介绍了OpenAI的新功能,通过ChatGPT的4o模型创建高质量的图像,包括图像生成、多轮生成、指令遵循、上下文关联、现实知识贯通、风格多样等特点。同时,也提到了一些存在的问题和限制。
关键观点总结
关键观点1: OpenAI通过4o模型创建图像的特点
包括光影、文字、细节栩栩如生;多轮生成很棒;可通过对话逐步进行图像完善,并保持内容一致等。
关键观点2: 4o模型的指令遵循能力强
可以处理包含10-20个不同物体的场景,并对物体与特征及关系的紧密绑定允许更好的控制。
关键观点3: 新功能的适用范围和推出情况
这项功能已经向Plus、Pro、Team和免费用户推出,替换DaLLE作为默认图像生成器。Enterprise和Edu用户也将很快更新,API也将在数周内进行更新。
关键观点4: 该模型存在的问题和限制
对于长图像会出现剪裁问题,可能产生幻觉,难以准确渲染超过20个不同概念,多语言文本渲染不够准确等。
文章预览
ChatGPT 凌晨发了新东西, 通过 4o 模型,创建靠谱的图像:光影、文字、细节栩栩如生 通过对话,可以进一步修改:遮挡、倒影等等都处理的非常到位 图片质量相当高,可直接用于科普插画 ,比如:分光三棱镜 继续对话,一致性相当好 ,比如让他画成书册: 只能说: 斗宗强者,竟恐怖如斯,OpenAI 的箱子里,还是有东西的。 让我们细致看一看: 本次更新,突破了以往的哪些边界。 文本渲染绝佳 一图胜千言,来感受一下。比如让他根据对话内容,来画一个菜单(文字是单独给的) 或者让他去画一个婚礼邀请(同样,文字单独给到) 多轮生成很棒 这套图像生成,是 GPT-4o 的原生功能, 可通过对话,逐步进行图像完善,并保持内容一致 。比如这个: 也比如我把橘猫放在了魔兽世界里 甚至来说,我还 可以要求他生成 png 透明版 指令遵循很强 在生
………………………………