文章预览
点击下方 卡片 ,关注“ 慢慢学AIGC ” 大型语言模型的力量比你想象的更强大 在开始这篇文章之前,我想说我没有任何偏见。如果你在网上进行批判性搜索,你会发现无数其他文章和经历都在解释强化学习根本无法用于真实世界的用例。唯一说相反观点的是该领域的课程创建者和学者。 我是真心希望强化学习能成功的。5 年前,当我第一次听说强化学习时,人们许诺它将革新整个世界。只需一个设计巧妙的奖励机制,就能优化任何事物,这种算法似乎可以被广泛应用于从设计药物到高级机器人等各个领域。2016年,当 AlphaGo 在围棋比赛中击败李世石时,这应该是强化学习开始主导的转折点。 然而,8 年后的今天,这一切都没有实现。强化学习在现实世界中一事无成。它在玩具问题和电子游戏上占据主导地位,但仅此而已。强化学习在过去 8 年里唯
………………………………