专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

NeurIPS2024|提高专业生产力,让你的AI画作布局可控,360 AI Research开源新模型HiCo

极市平台  · 公众号  ·  · 2024-10-31 22:00

主要观点总结

本文介绍了360人工智能研究院在NeurIPS 2024上提出的布局可控AI绘画模型HiCo。该模型允许用户通过矩形框和文本描述控制生成画面中不同主体的布局,实现更精确的图像生成效果。HiCo模型解决了对象丢失、光影不一致等问题,并在多个数据集上展现了其在生成质量和推理速度方面的优势。

关键观点总结

关键观点1: HiCo模型的核心特点

HiCo模型通过层次化建模和融合模块,解耦不同目标的空间布局,并引入布局可控的能力。该模型可以生成高质量和逼真的图像,同时解决对象丢失、光影不一致等问题。

关键观点2: HiCo模型的工作流程

HiCo模型采用分层特征可视化技术,根据文本描述和空间布局信息,解耦不同的前景实例和背景图像生成独立的特征。这些特征在上采样阶段被战略性集成,以生成最终的图像。

关键观点3: HiCo模型的实验评估

HiCo模型在细粒度描述定量评估中取得显著效果,生成的高质量图像在简单和复杂布局信息的情况下均表现良好。人工评估结果表明,HiCo模型在空间位置和语义维度方面优于其他模型。


文章预览

↑ 点击 蓝字  关注极市平台 作者丨360 AI Research 来源丨我爱计算机视觉 编辑丨极市平台 极市导读   本文介绍了360人工智能研究院在NeurIPS 2024上提出的布局可控AI绘画模型HiCo,该模型允许用户通过矩形框和文本描述控制生成画面中不同主体的布局,实现更精确的图像生成效果。HiCo模型通过层次化建模和融合模块解决了对象丢失、光影不一致等问题,并在多个数据集上展现了其在生成质量和推理速度方面的优势。  >> 加入极市CV技术交流群,走在计算机视觉的最前沿 AI绘画模型一直以来被概括为“文生图”模型,究其原因,是因为当前的主流图像生成模型基本都只提供了基于文本条件生成图像的能力,各家的AI绘画产品也主要在生成画质和文本理解能力上进行竞争。但对于专业的使用者来说,文本能提供的画面控制能力非常有限,导致当前的AI绘画 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览