今天看啥  ›  专栏  ›  中金点睛

中金 | AI十年展望(十九):渐行渐近的AI Agent:能力升级,场景创新

中金点睛  · 公众号  · 金融  · 2024-05-29 07:35
文/于钟海,魏鹳霏,游航,王倩蕾,王之昊中金研究近期UI交互等多模态大模型持续迭代,有望加速AI Agent落地节奏。在本篇报告中,我们从能力升级和场景创新两个维度探索AI Agent落地方式和形态,我们认为AI Agent是连接大模型和现实世界的“最后一公里”。点击小程序查看报告原文Abstract摘要能力升级:UI识别和操作模型推动垂直场景生产力提效。Ferret-UI:苹果首个手机端UI多模态大模型,得益于使用了大量UI数据集训练和引入了“任意分辨率”技术,擅长理解屏幕微小元素,在大多数移动端基础UI任务中超越GPT-4V。Adept:推出Fuyu系列多模态模型,Fuyu-8B架构简洁,低延时、灵活性高,Fuyu-Heavy具备出色的UI理解和数学推理能力,专为Digital Agent设计。OpenAI GPT-4o:原生多模态赋能,多模态交互和情绪理解能力出色,可有效提高人机交互体验。能力升级的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照