专栏名称: 纯银V
shock的爬行界暴躁男子
今天看啥  ›  专栏  ›  纯银V

周末听到一个技术案例,有人用大模型训练人格,其中一个步骤是模拟玩-20240708233421

纯银V  · 微博  · 热门自媒体  · 2024-07-08 23:34
    

文章预览

2024-07-08 23:34 本条微博链接 周末听到一个技术案例,有人用大模型训练人格,其中一个步骤是模拟玩游戏这个过程。训练了十几个人格,发现大多数都躺平了,不好好玩游戏。 躺平的原因很简单,虚拟人格试了一会儿,搞不明白游戏怎么推进到下一步,下两步,直接躺倒,消极怠工。 只有少数一两个虚拟人格,没用多少时间找到了推进游戏的方法,于是玩得特别来劲。 最后我们感慨道,正反馈对人类真的太重要了。 人 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览