今天看啥  ›  专栏  ›  国泰君安证券研究

国君电子|AutoGLM解放用户双手,AI Agent开启新篇章

国泰君安证券研究  · 公众号  · 证券  · 2024-10-28 06:16

文章预览

投资建议。 AutoGLM精准理解用户指令,并可自动驾驶完成App操作,为手机AI Agent提供技术范式,有望加速手机厂商AI Agent落地,驱动AI手机换机潮,带动上游产业链需求上行。 AutoGLM基于OCR理解UI组件信息,通过链式思维训练理解组件功能。 根据清华大学发布的《AutoWebGLM: A Large Language Model-based Web Navigating Agent》,AutoWebGLM通过OCR模块解析页面截图并将其转化为易于LLM理解的HTML,帮助LLM理解UI功能及所处页面位置。通过GPT-4的链式思维推理,生成UI与执行动作对应意图的QA问答数据集,并对AutoGLM进行训练,使其可根据用户指令,确定用户意图所需UI组件,并自动完成相应操作。 自动驾驶仍需明确指令,个性化场景需与手机厂商合作,跨应用操作待改善。 根据数字生命卡兹克发布的实测视频,AutoGLM自动驾驶需要用户下达明确的指令信息,如预订酒店,需要 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览