专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

波士顿大学团队提出无尺度强化学习算法，能用于金融交易和自动驾驶

DeepTech深科技 · 公众号 · 科技媒体 · 2024-04-27 14:57

文章预览

强化学习（Reinforcement Learning, RL）是一种机器学习的范式，主要关注的是在特定环境中，如何通过智能体与环境的交互来学习最优行为或策略，以最大化某种累积奖励。它与监督学习和无监督学习不同的是，强化学习不是从带标签的数据集中学习，而是通过智能体在环境中采取行动，并根据行动的结果（奖励或惩罚）来学习。强化学习已被广泛用于多种领域，包括游戏（如 AlphaGo）、自动驾驶汽车、机器人控制、推荐系统等。通过强化学习，机器可以自主学习如何在复杂环境中做出决策，以实现特定的目标。然而，目前强化学习研究的一个痛点是，为了保证学习率能被合适地设定，现有算法需要对奖励或惩罚的规模需要被限制。举例来说，对于现有的绝大数强化学习问题，一个默认的假设是奖励或惩罚对应的值位于 [-1, 1] 之间。在这种情况下， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【看房要排队半小时！#广深售楼部挤满了买房的人# 】#假期第2天-20241003151433

2 天前

新浪科技 · 【#上海以旧换新补贴拉动销售9亿元#】上海交电家电商业行业协会秘-20241003141200

2 天前

新浪科技 · 【10月起，这些新规施行】#一线城市房地产新政组合拳陆续落地# -20241001075054

5 天前

新浪科技 · 【乘联会崔东树：#预计2024年国内汽车零售销量将达2230万辆-20240928225640

1 周前

新浪科技 · #开户明显激增#【线上开户排队近1小时机构加仓、两融意愿强烈】-20240927195000

1 周前