今天看啥  ›  专栏  ›  调研纪要

AI Agent新篇章

调研纪要  · 公众号  · 科技自媒体  · 2024-10-27 23:56

主要观点总结

本文介绍了智谱AI推出的自主智能体AutoGLM,可模拟用户使用手机界面的过程,并在手机应用程序及网页上执行用户指令。文章还提到了AutoGLM的背景、功能、训练方式、实际应用以及与手机厂商的合作情况。此外,还涉及AI Agent在硅谷的重要性以及相关的创业趋势和概念股梳理。

关键观点总结

关键观点1: 智谱AI推出自主智能体AutoGLM

AutoGLM可模拟用户点击屏幕的手机操作助手及网页浏览器助手,基于OCR理解UI组件信息,通过链式思维训练理解组件功能。

关键观点2: AutoGLM的应用与训练

AutoGLM可通过GPT-4的链式思维推理进行训练,并根据用户指令确定用户意图所需的UI组件,自动完成相应操作。目前已在一些App中实现了自动执行常用操作,但个性化操作及跨应用操作仍需改进。

关键观点3: 与手机厂商的合作

智谱AI与荣耀等手机厂商有深度合作,共同成立AI大模型技术联合实验室,共同开发具备自动驾驶功能的AI Agent,有望驱动AI手机渗透率提升。

关键观点4: AI Agent的重要性及创业趋势

AI Agent是应用的最重要方向,无论是2B还是2C。未来1年会迎来一波AI Infra公司的ipo潮。相关概念股包括股东、算力提供方和合作方等。


文章预览

事件:10月25日,智谱AI推出自主智能体AutoGLM,可以模拟用户使用手机界面的过程,在手机应用程序以及网页上进行操作,包括根据用户给出的指令完成购物、进入应用程序完成文字填充、总结等。 1、背景: 今年年初,OpenAI被爆出将自研AI Agent软件,它可替代人类,自动导航至任何网站并执行指定任务。10月25日,智谱AI推出相似产品——自主智能体AutoGLM,智谱将其称为是一个可模拟用户点击屏幕的手机操作助手,以及点击网页的浏览器助手。同时,智谱AI还推出了端到端情感语音模型GLM-4-Voice 。此外,苹果宣布Apple Intelligence的正式公开版本将于下周在iOS 18.1中上线。 2 、AutoGLM基于OCR理解UI组件信息,通过链式思维训练理解组件功能。 根据清华大学发布的《AutoWebGLM: A Large Language Model-based Web Navigating Agent》,AutoWebGLM通过OCR模块解析页面截图并将其转 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览