专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
今天看啥  ›  专栏  ›  3D视觉工坊

解锁4D人类-场景交互!斯坦福新作ZeroHSI:利用视频生成模型,带来前所未有的交互多样性!

3D视觉工坊  · 公众号  ·  · 2024-12-31 07:00
    

文章预览

点击下方 卡片 ,关注 「3D视觉工坊」 公众号 选择 星标 ,干货第一时间送达 来源:3D视觉工坊 添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。 扫描下方二维码,加入 「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门秘制视频课程 、 最新顶会论文 、计算机视觉书籍 、 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入! 0.这篇文章干了啥? 这篇文章提出了一种名为ZeroHSI的零-shot方法,用于生成4D人类-场景交互(HSI)。与传统方法需要配对的运动-场景训练数据不同,ZeroHSI通过利用视频生成模型和神经渲染技术,能够在多种不同环境中生成上下文相关的交互。文章详细展示了该方法在静态和动态场景中的应用, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览