OccLLaMA：首个结合3D占用预测、语言、行为构建的生成式世界模型

3DCV · 公众号 · · 2024-09-25 11:00

文章预览

点击下方卡片，关注「3DCV」公众号选择星标，干货第一时间送达来源：深蓝AI 添加小助理：cv3d008，备注：方向+学校/公司+昵称，拉你入群。文末附3D视觉行业细分群。扫描下方二维码，加入「 3D视觉从入门到精通」知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门独家秘制视频课程、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！导读： OccLLaMA是首个结合3D占用预测作为视觉表征的生成式世界模型。大量实验表明，OccLLaMA在多个任务上实现了不错的性能，包括4D占用预测、运动规划和视觉问答，展示了其作为自动驾驶基础模型的潜力。 ©️【深蓝AI】编译多模态大型语言模型（Multimodal Large Language Models，MLLMs）的兴起促进了它们在自动驾驶中的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

GiantPandaCV · [分布式训练与TorchTitan] PyTorch中的Async Tensor Parallelism介绍

2 天前

GiantPandaCV · 使用torchtune把LLaMa-3.1 8B蒸馏为1B

2 天前

GiantPandaCV · 图解Megatron TP中的计算通信overlap

4 天前

神嘛事儿 · 饿醒了啊[淡淡的]吃了三周的莴苣了 -20240630030752

6 月前

福州教育 · 不吵不闹，陪娃写作业的小妙招！

3 月前

Excel办公自动化 · 自从进了这个京东捡漏福利群，拿了很多0元商品，还有很多秒杀呢！

2 月前