专栏名称: Hugging Face
The AI community building the future.
目录
相关文章推荐
今天看啥  ›  专栏  ›  Hugging Face

GAIA: 一个严苛的智能体基准

Hugging Face  · 公众号  ·  · 2024-07-09 10:30
    

文章预览

简要概括 经过一些实验,我们对 Transformers 智能体构建智能体系统的性能印象深刻,因此我们想看看它有多好!我们使用一个 用库构建的代码智能体 在 GAIA 基准上进行测试,这可以说是最困难、最全面的智能体基准测试……最终我们取得了第一名的成绩! 用库构建的代码智能体 https://github.com/aymeric-roucher/GAIA GAIA: 一个严苛的智能体基准 什么是智能体? 一句话: 智能体是基于大语言模型 (LLM) 的系统,可以根据当前用例的需要调用外部工具,也可以不调用,并根据 LLM 的输出进行后续步骤的迭代。工具可以包括从 Web 搜索 API 到 Python 解释器的任何东西。 形象类比: 所有程序都可以描述为图表。先做 A,再做 B。If/else 分支是图中的岔路口,但它们不会改变图的结构。我们将 智能体 定义为: LLM 输出将改变图结构的系统。智能体决定调用工具 A 或工具 B ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览