今天看啥  ›  专栏  ›  大语言模型论文跟踪

Awesome Mobile Agent:21个可以自动执行任务的移动端多模态Agent

大语言模型论文跟踪  · 公众号  ·  · 2024-11-10 20:08
    

文章预览

Awesome Mobile Agent:21个可以自动执行任务的移动端多模态Agent 发布时间:2024 年 11 月 04 日 多模态大模型 Foundations and Recent Trends in Multimodal Mobile Agents: A Survey 摘要:移动代理对于在复杂和动态的移动环境中自动执行任务至关重要。随着基础模型的发展,对能够实时适应和处理多模态数据的代理的需求不断增长。本调查对移动代理技术进行了全面审查,重点关注增强实时适应性和多模态交互的最新进展。最近已经开发了更好的评估基准来捕捉移动任务的静态和交互环境,为代理的性能提供更准确的评估。然后,我们将这些进展分为两种主要方法:基于提示的方法,利用大型语言模型(LLM)进行基于指令的任务执行;基于训练的方法,为移动特定应用微调多模态模型。此外,我们还探讨了增强代理性能的补充技术。通过讨论关键挑战并概述未来的研究方 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览