文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) ————B1.1 Part———— Topic: Multi-modal|GUI Agent, Math Reasoning Agent S: An Open Agentic Framework that Uses Computers Like a Human 2024-10-10|Simular Research |⭐️ http://arxiv.org/abs/2410.08164v1 https://github.com/simular-ai/Agent-S 概述 本文介绍了Agent S,一个开放的自主代理框架, 旨在通过图形用户界面(GUI)实现计算机的自主交互 。Agent S的设计目标是自动化复杂的多步骤任务,解决在计算机任务自动化中面临的三个主要挑战:获取领域特定知识、进行长时间任务规划以及处理动态和不均匀的用户界面。为此,Agent S引入了经验增强的分层规划方法,通过外部知识检索和内部经验检索来提高任务规划的效率。此外,Agent S还采用了代理-计算机接口(ACI),以增强基于多模态大语言模型(MLLM)的GUI代理的推理
………………………………