专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

谷歌DeepMind新RL方法·SCoRe，让我后背一紧

AINLP · 公众号 · · 2024-09-24 22:07

文章预览

就在上周五(09/20)，来自Google DeepMind的研究人员提出了一种创新多轮强化学习方法——SCoRe。这篇论文在周末粗读下来后，当时给我最直观感受是稀松平常，并略带一些遗憾，但同冥冥之中也总感觉哪里不对，一直有个小困惑留在了心底.. 在今天清晨也不知哪一小簇神经元 & 突触'刺棱'一下将电信号传播到了另一片稠敏的敏感又或纠结区域，不由自主的又翻看了一遍这篇论文，并赫然发现了让我“后背一紧”东东... ps：这里插一段背景和预告，本来今天是想跟大伙唠唠“李飞飞的空间智能” vs “openAI o1”这两条可能通往未来AGI不同路线间差异与共性挑战的，但这一更广泛的领域其实涉及蛮多跨领域跨模态的诸多问题，也没有思考太彻底，就先暂时放一放，先聚焦google的这篇论文快速把给我的洞察和启示分享给大伙。回到本篇论文，在第一次读到这 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博