专栏名称: 图灵人工智能

人工智能及其他科技学术前沿、机器学习、图像识别、语音识别、自动驾驶、自然语言处理、脑机接口、云计算、大数据、物联网、机器人、天文物理、生物科学、数学、区块链、比特币、计算机等学术前沿知识、报告、讲座等介绍。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

强化学习中的统计推断——假设检验篇（上）

图灵人工智能 · 公众号 · · 2024-09-19 00:00

文章预览

作者介绍史成春，伦敦政治经济学院统计系副教授。 1 引言相信你对强化学习一定不陌生。它旨在研究AI如何实时做出决策，以最大化人类决策者的长期收益(Sutton and Barto, 2018)。在过去的十年中，它是人工智能领域最热门的研究方向之一。谷歌学术的搜索结果显示，2023年发表了超过13万篇包含“强化学习”关键词的文章。在2024年的人工智能顶会ICML中，共有2609篇文章被接收，其中255篇涉及强化学习，占总接收文章数的10%。在统计学领域的“四大天王”杂志中，也有众多关于强化学习的研究见刊 (Chen et al., 2024; Ertefaie and Strawderman, 2018; Hu and Wager, 2023; Luckett et al., 2020; Liao et al., 2021, 2022; Li et al., 2024; Ramprasad et al., 2023; Shi et al., 2022, 2023a; Wang et al., 2023; Yang et al., 2022; Zhou et al., 2024)。此外，近十年来，强化学习已在诸多领域广泛应用，包括电子游戏(Mnih et a ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

鼠绘情报站 · 提前过年？《当哒当》、《跃动青春》第2季动画制作决定！

2 天前

鼠绘情报站 · 海贼王1134话情报补充丨又一个神秘角色登场！伊姆盯上了艾尔巴夫！？

4 天前

赛雷三分钟 · 人造钻石都有了，为什么还没有人造黄金？

3 天前

一条漫画 · 我再也不会买那么多没用的东西！第二天...

5 天前

一条漫画 · 怀疑女朋友外面有其他男人，因为在她口袋里发现这种包装......

5 天前

Lacan心理 · GIM音乐引导想象治疗成长团体成员招募（第五期）！

5 月前

上海发布 · “雅思”组合圆梦！黄雅琼郑思维获得羽毛球混双金牌

4 月前