注册登录

专栏名称: 集智书童

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

晚点LatePost · 晚点独家丨Temu ... · 4 天前

高绩效HR · 精品内训 | 基于战略落地的目标和绩效管理 · 6 天前

清华经管学院职业发展中心 · 招聘 | 凡岛营销类岗位2025届校园招聘进行中！ · 1 周前

中国企业家杂志 · 孙正义最强副手卸任曾帮其募1000亿美元 · 1 周前

今天看啥 › 专栏 › 集智书童

单卡就能训的VLM来了！中科院提出MiniDrive：各项指标完爆当前SOTA~

集智书童 · 公众号 · · 2024-09-16 09:00

文章预览

今天自动驾驶之心为大家分享中科院最新的工作—MiniDrive！单卡就能训的VLM！如果您有相关工作需要分享，请在文末联系我们！自动驾驶课程学习与技术交流群事宜，也欢迎添加小助理微信AIDriver004做进一步咨询论文作者 | Enming Zhang等编辑 | 自动驾驶之心写在前面 & 笔者的个人理解视觉语言模型（VLM）是自动驾驶中的通用端到端模型，通过问答交互实现预测、规划和感知等子任务。然而大多数现有方法依赖于计算成本高昂的视觉编码器和大型语言模型（LLM），这使得它们难以在现实世界场景和实时应用中部署。同时大多数现有的VLM缺乏处理多幅图像的能力，因此难以适应自动驾驶中的环视感知。为了解决这些问题，我们提出了一个名为MiniDrive的新框架，该框架结合了我们提出的特征工程混合专家（FE-MoE）模块和动态指令适配器（DI-Adapter） ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

晚点LatePost · 晚点独家丨Temu 考虑推出平台模式，进一步放宽对商家的要求

4 天前

高绩效HR · 精品内训 | 基于战略落地的目标和绩效管理

6 天前

清华经管学院职业发展中心 · 招聘 | 凡岛营销类岗位2025届校园招聘进行中！

1 周前

中国企业家杂志 · 孙正义最强副手卸任曾帮其募1000亿美元

1 周前

求职汇 · 华夏银行2025届提前批校园招聘正式启动

4 月前

股市张望 · A股见底被延缓了

2 月前

锂电江湖 · 【JH-7667】中矿资源：锂铯铷版图成型，铜矿资源蓄力待发（38页）

2 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号