注册
登录
专栏名称:
专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
笔吧评测室
·
国补到手价 3199.2 元,机械革命无界 ...
·
2 天前
笔吧评测室
·
聊一款“加量不加价”的笔记本
·
2 天前
笔吧评测室
·
欧洲系统集成商开启英伟达 RTX 5090 ...
·
4 天前
笔吧评测室
·
微软宣布为三星 Galaxy Book 4 ...
·
6 天前
笔吧评测室
·
聊聊笔记本行业里“抢饭碗”的现象
·
6 天前
今天看啥
›
专栏
›
专知
【斯坦福博士论文】数据高效的强化学习:在复杂环境中决定学习什么
专知
·
公众号
· · 2024-09-23 12:00
文章预览
强化学习是机器学习中专注于序列决策问题的范式。与机器学习和统计学的许多其他领域一样,数据效率常常是一个主要关注点;即,一个序列决策的智能体需要多少试验与错误的交互数据才能学习到所需的行为?数据效率低下的强化学习面临的一个关键障碍是探索问题,即智能体必须在获取新知识与利用当前知识以最大化近期性能之间找到平衡。传统的探索与利用平衡的文献主要针对智能体能够在相关的时间框架内接近最优性能的环境。然而,现代人工决策智能体所面对的复杂环境(例如万维网)使得在任何相关的时间框架内接近最优性能几乎无望。 本论文的重点是开发应对复杂环境中探索问题的有原则且实用的方法。我们的方法基于一个简单的观察,即面对如此复杂的环境时,智能体不应致力于获取足够的信息以实现最优行为,而应瞄准一个 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
笔吧评测室
·
国补到手价 3199.2 元,机械革命无界 15 Pro 笔记本新增 R7-8745HS 版本
2 天前
笔吧评测室
·
聊一款“加量不加价”的笔记本
2 天前
笔吧评测室
·
欧洲系统集成商开启英伟达 RTX 5090 显卡 AI 工作站预订,8 卡配置定价 5 万欧元
4 天前
笔吧评测室
·
微软宣布为三星 Galaxy Book 4 Edge/ Book 5 Pro 360 笔记本推出 Recall AI 快照预览版
6 天前
笔吧评测室
·
聊聊笔记本行业里“抢饭碗”的现象
6 天前
生命科学产业观察
·
凯普瑞生物完成数千万元Pre-A+轮融资,磐霖资本独家投资
4 月前
佳木斯日报
·
“中国移动杯”2024年佳木斯市网络安全微视频征集活动开始啦
3 月前
广东科学技术职业学院
·
开学前!最后一“叮”咛
3 月前
Web3天空之城
·
特朗普·竞选路演·Rocky Mount, NC | 2024.10.30 【中英精校完整版】
1 月前