文章预览
作者 | NNU三维世界 编辑 | NNU三维世界 点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群 导读 本期推文小编向大家介绍两篇关于将文本与三维点云数据结合的工作,分别是 《RefMask3D: Language-Guided Transformer for 3D Referring Segmentation》 《SceneGPT: A Language Model for 3D Scene Understanding》 欢迎大家讨论交流!!! 01 题目: RefMask3D: Language-Guided Transformer for 3D Referring Segmentation 作者:Shuting He,Henghui Ding 会议:ACM MM2024 论文链接 : https://arxiv.org/abs/2407.18244v1 代码链接: https://github.com/heshuting555/RefMask3D. 1 动机 三维参考分割是一项新兴且具有挑战性的视觉语言任务,旨在对点云场景中由自然语言表达描述的物体进行分割。这项任务背后的关键挑战是视觉语言特征的融合和对齐。在这项工作中,作者提出了RefMas
………………………………