专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

基于《街霸III》来实时评估LLM的性能,看哪个模型能成为最优秀-20240727142941

斌叔OKmath  · 微博  ·  · 2024-07-27 14:29
    

文章预览

2024-07-27 14:29 本条微博链接 基于《街霸III》来实时评估LLM的性能,看哪个模型能成为最优秀的AI“战士”。 该项目实现逻辑对于构建其他游戏的AI角色很有参考价值:每个玩家都由LLM控制,通过向 LLM 发送屏幕的文本描述, LLM决定其角色将要采取的下一步行动。接下来的动作取决于它之前的动作、对手的动作、它的力量和生命值。 该项目可以测评大模型以下能力: 快速:实时游戏中快速决策能力。 智能:优秀的AI角色能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览