专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
目录
相关文章推荐
深圳大件事  ·  夜读 | ... ·  3 天前  
深圳发布  ·  抢票 | 《孔雀》 ·  1 周前  
今天看啥  ›  专栏  ›  AINLP

谷歌DeepMind新RL方法·SCoRe,让我后背一紧

AINLP  · 公众号  ·  · 2024-09-24 22:07

文章预览

就在上周五(09/20),来自Google DeepMind的研究人员提出了一种创新多轮强化学习方法——SCoRe。 这篇论文在周末粗读下来后,当时给我最直观感受是稀松平常,并略带一些遗憾,但同冥冥之中也总感觉哪里不对,一直有个小困惑留在了心底.. 在今天清晨也不知哪一小簇神经元 & 突触'刺棱'一下将电信号传播到了另一片稠敏的敏感又或纠结区域,不由自主的又翻看了一遍这篇论文,并赫然发现了让我“后背一紧”东东... ps:这里插一段背景和预告,本来今天是想跟大伙唠唠“李飞飞的空间智能” vs “openAI o1”这两条可能通往未来AGI不同路线间差异与共性挑战的,但这一更广泛的领域其实涉及蛮多跨领域跨模态的诸多问题,也没有思考太彻底,就先暂时放一放,先聚焦google的这篇论文快速把给我的洞察和启示分享给大伙。 回到本篇论文,在第一次读到这 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览