专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
今天看啥  ›  专栏  ›  智驾实验室

LiGAR:基于LiDAR的多级群活动识别分层 Transformer !

智驾实验室  · 公众号  ·  · 2024-12-05 08:00
    

文章预览

ADAS  Laboratory 点击上方 蓝字 关注  智驾实验室           加入【 智驾实验室 】交流群, 获取更多内容和资料 群体活动识别(GAR)在计算机视觉领域仍具有挑战性,因为多智能体交互的复杂性。本文介绍了一种名为 LiDAR 的 LIDAR 引导的分层 Transformer ,用于多模态群体活动识别。 LiDAR 利用激光雷达数据作为结构骨架,指导视觉和文本信息处理,实现对遮挡和复杂空间布局的强健处理。 作者的框架包括一个多尺度激光 Transformer 、跨模态引导注意力以及自适应融合模块,用于在不同语义 Level 的多模态数据有效集成。 LiDAR 的分层架构捕获了从个体行为到场景级动态的多种粒度的群体活动。在 JRDB-PAR、排球和 NBA 数据集上的广泛实验表明 LiDAR 的优越性能,F1 得分在 JRDB-PAR 上提高了 10.6%,在 NBA 数据集上的平均每类准确率提高了 5.9%。 值得注意的是,在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览