主要介绍深度学习、强化学习、深度强化学习环境、算法原理与实现、前沿技术与论文、开源项目、场景应用等与DRL相关的知识
今天看啥  ›  专栏  ›  深度强化学习实验室

【Nature重磅】RL教父Rich. S. Sutton提出持续反向传播算法,Mujoco中效果良好,深度学习还不如浅层网络?

深度强化学习实验室  · 公众号  ·  · 2024-08-30 11:53

文章预览

本文转载自:机器之心 https://mp.weixin.qq.com/s/jeqXj3ez5DbItS7RpoVaSg 人工神经网络、深度学习方法和反向传播算法构成了现代机器学习和人工智能的基础。但现有方法往往是一个阶段更新网络权重,另一个阶段在使用或评估网络时权重保持不变。这与许多需要持续学习的应用程序形成鲜明对比。 最近,一篇发表在《nature》杂志上的研究论文《Loss of plasticity in deep continual learning》证明:标准的深度学习方法在持续学习环境中会逐渐失去可塑性(plasticity),直到它们的学习效果不比浅层网络好。 论文地址:https://www.nature.com/articles/s41586-024-07711-7 值得注意的是,人工智能先驱、强化学习教父、DeepMind 杰出研究科学家,阿尔伯塔大学计算机科学教授 Richard S. Sutton 是这篇论文的作者之一。 简单来说,该研究使用经典的 ImageNet 数据集、神经网络和学习算法的各种 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览