讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

URBANWORLD:用于 3D 城市生成的城市世界模型

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-08-06 00:02
    

文章预览

24年6月来自清华大学和北京科技大学的论文“UrbanWorld: An Urban World Model For 3D City Generation”。 城市作为人类生活的最基本环境,包含建筑、道路、植被等多种物理要素,且相互关联复杂。构建逼真的交互式三维城市环境对于构建能够在现实环境中像人类一样感知、决策和行动的AI智体起着至关重要的作用。然而,创建高保真三维城市环境通常需要设计者大量的手工劳动,涉及复杂的细节设计和复杂城市特征的准确表示。因此,如何以自动化的方式实现这一点仍然是一个长期的挑战。针对这个问题, UrbanWorld 作为第一个生成式城市世界模型,可以自动创建具有灵活控制条件的定制化、逼真且可交互的三维城市世界。UrbanWorld 在自动制作流程中整合了四个关键阶段:从可公开访问的 OSM 数据生成 3D 布局、使用强大的城市多模态大语言模型 (Urban MLLM) 进行 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览