今天看啥  ›  专栏  ›  机器之心SOTA模型

今日开源(2025-03-20):SpatialLM,3D大语言模型,处理点云数据,生成结构化场景理解,赋能机器人导航与空间推理

机器之心SOTA模型  · 公众号  ·  · 2025-03-20 18:45
    

文章预览

🏆基座模型 ①项目:SpatialLM ★SpatialLM是一个3D大语言模型,专为处理3D点云数据并生成结构化3D场景理解输出而设计。 这些输出包括建筑元素如墙壁、门、窗户以及带有语义类别的定向对象边界框。 SpatialLM能够处理来自单目视频序列、RGBD图像和LiDAR传感器的点云数据 ,提供高层次的语义理解,增强了在具身机器人、自主导航和其他复杂3D场景分析任务中的空间推理能力。 ☆一键收藏: https://sota.jiqizhixin.com/project/spatiallm ②项目:Soundwave ★Soundwave 是一个语音到文本的模型,旨在弥合语音和文本之间的差距。 该项目采用数据高效的策略和独特的架构,仅使用了10,000小时的数据进行训练。Soundwave 在语音翻译和AIR-Bench语音任务中表现出色,适合用于交互任务。 ☆一键收藏: https://sota.jiqizhixin.com/project/soundwave 🤖 Agent开发 ①项目:Motia ★Motia是一个为软 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览