注册
登录
专栏名称:
大语言模型和具身智体及自动驾驶
讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
半月谈
·
“3.5分餐厅”更好吃?评分体系如何做到不失真
·
4 小时前
终极较量
·
中方代表:十分失望,不可接受!
·
昨天
瞭望智库
·
植物工厂如何从集装箱走向市场
·
4 天前
今天看啥
›
专栏
›
大语言模型和具身智体及自动驾驶
STORM:为强化学习基于高效随机Transformer的世界模型
大语言模型和具身智体及自动驾驶
·
公众号
· · 2024-10-01 00:32
文章预览
23年10月来自北理工和清华的论文“STORM: Efficient Stochastic Transformer based World Models for Reinforcement Learning”。 最近,基于模型的强化学习算法,在视觉输入环境中表现出了显著的效果。这些方法首先通过自监督学习构建真实环境的参数化模拟 世界模型 。通过利用世界模型的想象力,智体的策略得到了增强,而不受从真实环境中采样的限制。这些算法的性能在很大程度上依赖于世界模型的序列建模和生成能力。然而,构建一个复杂未知环境的完美准确模型几乎是不可能的。模型和现实之间的差异可能会导致智体追求虚拟目标,而在真实环境中的表现不佳。在基于模型的强化学习中引入随机噪声已被证明是有益的。在这项工作中,引入了基于随机 Transformer 的世界模型 ( STORM ),这是一种高效的世界模型架构,它将 Transformer 强大的序列建模和生成能力与变 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
半月谈
·
“3.5分餐厅”更好吃?评分体系如何做到不失真
4 小时前
终极较量
·
中方代表:十分失望,不可接受!
昨天
瞭望智库
·
植物工厂如何从集装箱走向市场
4 天前
环球人物
·
她的爱情背后,是“首富爸爸”的关系网
4 月前
人间草木-槿
·
妈妈来,我和她说话,也要大声了。今年她开始耳背,不由想起之前听邻-20240825190716
2 月前