注册
登录
专栏名称:
数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
数据派THU
·
三元组损失Triplet loss 详解
·
3 天前
玉树芝兰
·
如何用 Web 界面 AI ...
·
2 天前
大数据文摘
·
精准“算病”!AI检测癌症,准确率高达94% ...
·
5 天前
大数据与机器学习文摘
·
谢尔盖布林:谷歌不敢用Transformer ...
·
4 天前
今天看啥
›
专栏
›
数据派THU
视觉语言导航:大模型时代的综述
数据派THU
·
公众号
·
大数据
· 2024-09-09 17:00
文章预览
来源:专知 本文 约3000字 ,建议阅读 5 分钟 在本综述中,我们提供了一种自上而下的审视方法,采用了一种原则性框架进行具身规划和推理,并强调了利用基础模型应对VLN挑战的当前方法和未来机会 。 视觉与语言导航(VLN)近年来受到越来越多的关注,许多方法已经涌现出来以推动其发展。基础模型的显著成就已经塑造了VLN研究的挑战和提出的方法。 在本综述中,我们提供了一种自上而下的审视方法,采用了一种原则性框架进行具身规划和推理,并强调了利用基础模型应对VLN挑战的当前方法和未来机会 。我们希望通过深入的讨论提供有价值的资源和见解:一方面,用以标记进展里程碑,探索基础模型在该领域的机会和潜在作用;另一方面,为基础模型研究者整理VLN中的各种挑战和解决方案。 开发能够与人类及其周围环境互动的具身代理是人工 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
数据派THU
·
三元组损失Triplet loss 详解
3 天前
玉树芝兰
·
如何用 Web 界面 AI 工作流提升科研写作效率?
2 天前
大数据文摘
·
精准“算病”!AI检测癌症,准确率高达94%,研究登上Nature
5 天前
大数据与机器学习文摘
·
谢尔盖布林:谷歌不敢用Transformer,作者剩一人了,现在我每天都在写代码
4 天前