专栏名称: AIGC Research
AIGC Research|AI for Creativity Plan (AI4C Plan)|from ShanghaiTech University|致力于探索AIGC赋能创意智能|保持卓越学术品位和极致艺术追求
今天看啥  ›  专栏  ›  AIGC Research

210-B1|GUI智能体,LLM数学推理;多模态视觉语言系列;文档RAG,视频摘要;基于感兴趣区域的视频编辑

AIGC Research  · 公众号  ·  · 2024-10-14 23:00

文章预览

AIGC   Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) ————B1.1 Part———— Topic: Multi-modal|GUI Agent, Math Reasoning Agent S: An Open Agentic Framework that Uses Computers Like a Human 2024-10-10|Simular Research |⭐️ http://arxiv.org/abs/2410.08164v1 https://github.com/simular-ai/Agent-S 概述 本文介绍了Agent S,一个开放的自主代理框架, 旨在通过图形用户界面(GUI)实现计算机的自主交互 。Agent S的设计目标是自动化复杂的多步骤任务,解决在计算机任务自动化中面临的三个主要挑战:获取领域特定知识、进行长时间任务规划以及处理动态和不均匀的用户界面。为此,Agent S引入了经验增强的分层规划方法,通过外部知识检索和内部经验检索来提高任务规划的效率。此外,Agent S还采用了代理-计算机接口(ACI),以增强基于多模态大语言模型(MLLM)的GUI代理的推理 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览