专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

刚刚,OpenAI首个L3级智能体深夜觉醒!AI自己玩电脑引爆全网,AGI一触即发

新智元  · 公众号  · AI  · 2025-01-24 05:25
    

主要观点总结

OpenAI发布了首个智能体Operator,它可以直接与界面交互,实现了L3级智能体。核心技术Computer-Using Agent(CUA)能够像人类一样使用电脑完成各种任务,无需依赖特定网站的API。它在多个基准测试中表现出强大的能力,但在一些复杂场景和特定网站上仍需优化。OpenAI强调安全性是首要任务,并会不断改进安全措施。

关键观点总结

关键观点1: Operator的发布及功能特点

OpenAI发布了首个智能体Operator,可以直接与界面交互,像人类一样使用电脑完成各种任务。

关键观点2: 核心技术Computer-Using Agent(CUA)的介绍

CUA被训练用于与图形用户界面(GUI)进行交互,就像人类一样。它可以通过感知、推理和行动来执行任务。

关键观点3: CUA在多个基准测试中的表现

CUA在WebArena和WebVoyager等基准测试中表现出强大的能力,但在更复杂的任务中仍需进一步优化。

关键观点4: CUA的可靠性问题

CUA并非100%可靠,它在处理不同的网站和用户界面时,可靠性会有所不同。提供具体的时间和界面元素提示可以提高其可靠性。

关键观点5: OpenAI对安全性的重视

OpenAI将安全性作为首要任务,采取了一系列措施来应对智能体访问数字世界所带来的挑战。


文章预览

   新智元报道   编辑:编辑部 HYZ ‍ 【新智元导读】 OpenAI首个智能体Operator,刚刚震撼登场。从此,AI打破API局限,可以像人类一样直接和界面交互了。L3级智能体达成,AGI路上一大障碍又被扫清! 刚刚,OpenAI首个智能体终于亮相了! 奥特曼带领团队毫无预警地开启半小时「Operator」在线直播,首次揭秘能像人类一样使用电脑的AI。 Sam Altman,Yash Kumar,Casey Chu,Reiichiro Nakano 演示中,AI智能体不仅可以精准理解指令,还能自主完成各类任务。 而它的独特之处在于,可以直接与网页交互——打字、点击、滚动,几乎一气呵成。 比如,自动填写繁琐的在线表单、上网购物、创建表情包、处理重复性浏览器任务等等。 「Operator」背后操盘手便是Computer-Using Agent (CUA),打破了特定编程接口的局限,像人类一场直接与GUI进行交互。 从此,通往AGI道路上的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览