专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

Talk预告|北京大学张嘉曌:NaVid - 视觉语言导航大模型

将门创投  · 公众号  · 科技创业  · 2024-06-19 09:00
    

文章预览

本期为 TechBeat人工智能社区 第 602 期 线上Talk。 北京时间 6 月20日 (周四)20:00, 北京大学博士生 张嘉曌 的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主题是:  “ NaVid - 视觉语言导航大模型 ” , NaVid是首个专为视觉语言导航(VLN)任务设计的基于视频的具身大模型。NaVid使用导航过程中的视频观测和自然语言指令作为输入,直接输出机器人的导航动作。与大部分已有的机器人导航技术不同,NaVid不依赖于深度信息、里程计和地图,完全依靠RGB视觉感知实现端到端的导航控制。它仅利用模拟器的数据进行导航策略学习,就能在真实世界的场景中实现泛化的导航表现。 该工作已入选RSS'24。 Talk·信息 ▼ 主题:NaVid - 视觉语言导航大模型 嘉宾:北京大学博士生 张嘉曌 时间:北京时间  6 月20日(周四)20:00 地点:TechBeat人工智能社区 http://www.techb ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览