文章预览
今天给大家介绍一个北京市人工智能研究院 提出的统一的图像生成模型OmniGen,可以使用它来执行各种任务,包括但不限于文本到图像生成、主题驱动生成、身份保留生成、图像编辑和图像条件生成。OmniGen不需要额外的插件或操作,它可以根据文本提示自动识别输入图像中的特征(例如所需对象、人体姿势、深度映射)。 相关链接 • 论文:https://arxiv.org/pdf/2409.11340 • 代码:https://github.com/VectorSpaceLab/OmniGen • 试用:https://huggingface.co/spaces/Shitao/OmniGen 概述 OmniGen 是一个统一的图像生成模型,可以根据多模态提示生成各种图像。它设计简单、灵活且易于使用。作者已经提供了推理代码,以便每个人都可以探索 OmniGen 的更多功能。 现有的图像生成模型往往需要加载多个额外的网络模块(如 ControlNet、IP-Adapter、Reference-Net 等)并执行额外的预处理步骤(
………………………………