文章预览
知乎:https://zhuanlan.zhihu.com/p/15540521427 Agent在2024上半年还是一个特别火的话题,下半年似乎大家都对其祛魅了。 什么Agent,不过是LLM套壳而已。 相比于Reasoning能力的突飞猛进,绝大多数Agent的论文还停留在讲故事的层次。把Memory、Planner、Runner、Reflection、Verifier什么的搭个积木出来,在某个场景里调prompt调work了,就是一篇论文。多的就再采点数据调一调。 当然,我也是这么干的。 本文就从技术角度分享,我觉得做Agent难在哪儿。 Agent不是玩具 大家真正想要的Agent绝对不是玩具,Agent本身就是冲着落地、提高生产力去的。 个人认为,Agent 30%、60%、80%的成功率,本质上都是0,因为没有人会去用。Agent完成一个任务往往需要十次以上的LLM inference,其中一个步骤的错误,往往导致整个任务直接失败。假设每个步骤的成功率都是0.95,十次都成功的概率就只有
………………………………