专栏名称: 自动驾驶之星
自动驾驶之星,是一个以自动驾驶量产交流为主的社区。这里有自动驾驶量产第一线的前沿动态,有一群奋斗在自动驾驶量产第一线的小伙伴在分享他们的量产经历。期待你的加入!希望每个人在这个浪潮中都能成为自动驾驶之星!
今天看啥  ›  专栏  ›  自动驾驶之星

南大 & 吉大 & 移动 优化Pipeline设,VLM 和 LLM 助力提升物体图像修复效果 !

自动驾驶之星  · 公众号  ·  · 2024-08-12 06:00
    

文章预览

点击下方 卡片 ,关注“ 自动驾驶之星 ” 这里有一群奋斗在自动驾驶 & 座舱量产第一线的小伙伴等你加入 在图像修复领域,尤其是通过扩散建模的最新进展,已经取得了令人鼓舞的成果。然而,在涉及基于前景物体完成图像的场景中,目前旨在以端到端方式修复图像的方法遇到了诸如“过度想象”、前景与背景之间的不一致以及多样性有限等挑战。为此,作者推出了Anywhere,这是一个开创性的多代理框架,旨在解决这些问题。Anywhere采用了一个复杂的流水线框架,包含视觉语言模型(VLM)、大型语言模型(LLM)和图像生成模型等各种代理。 该框架主要由三个主要组成部分构成:提示生成模块、图像生成模块和结果分析器。提示生成模块对输入的前景图像进行语义分析,利用VLM预测相关的语言描述,并使用LLM推荐最佳的语言提示。 在图像生成模块 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览