一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
今天看啥  ›  专栏  ›  深度学习自然语言处理

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

深度学习自然语言处理  · 公众号  ·  · 2025-01-12 15:41
    

文章预览

编辑:机器之心 本论文的主要作者 Chaoyun Zhang、Shilin He、Liqun Li,Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队,为微软 Windows GUI Agent UFO 的核心开发团队的成员。 LLM所有 细分方向 群+ ACL25/ICML25/NAACL25 投稿群-> LLM所有细分领域群、投稿群从这里进入! 图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。从简单的图标、按钮、窗口到复杂的多应用工作流程,GUI 为用户提供了直观、友好的操作体验。 然而,在自动化和智能化升级的过程中,传统的 GUI 操控方式始终面临诸多技术挑战。 以往的脚本化或规则驱动方法在特定场景下确实有所帮助,但随着现代应用环境的日益复杂和动态化,它们的局限性愈发凸显。 近年,人工智能与大语言模型(Large Language Models, LLMs)的快速发展为此领域带来 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览