专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

Anthropic让AI像人一样用电脑,支持开发者通过API配置和调用

DeepTech深科技  · 公众号  · 科技媒体  · 2024-10-23 07:24

主要观点总结

知名AI初创公司Anthropic发布了Claude 3.5模型家族的更新,包括新模型Claude 3.5 Haiku和升级版Claude 3.5 Sonnet。其中,Claude 3.5 Sonnet获得了一项革命性的新技能:能够像人类一样操作电脑,这项功能目前处于Beta公测阶段。通过Computer Use功能,Claude能够模拟人类与计算机交互的方式,使用计算机完成各种任务。此次更新还涵盖了模型的性能提升和安全性验证。

关键观点总结

关键观点1: Claude 3.5模型的新技能

Claude 3.5 Sonnet获得了Computer Use功能,能够像人类一样操作电脑,包括移动光标、点击按钮、使用虚拟键盘输入文本等操作。

关键观点2: 模型性能的提升

新版Claude 3.5 Sonnet在各项基准测试中表现优异,如在SWE-bench Verified评测中得分从33.4%大幅跃升至49.0%,超越包括OpenAI o1-preview在内的所有公开可用模型。

关键观点3: 模型的安全性验证和风险防范

考虑到AI技术可能带来的滥用风险,Anthropic在更新中格外强调模型的安全性。该公司采取了多种措施来识别和减轻潜在滥用风险,包括开发新的分类器、加强安全性监控等。

关键观点4: 新模型Claude 3.5 Haiku的推出

此次更新中还推出了Claude 3.5 Haiku模型,它是Claude 3.5系列中体积最小但响应速度最快的模型。它具备全面的技能提升,并在多个智能基准测试中表现出色。


文章预览

起猛了!一觉醒来,AI学会像人类一样操作电脑了! 当地时间10月22号,知名AI初创公司Anthropic发布了Claude 3.5模型家族的更新:新模型Claude 3.5 Haiku发布,同时现有模型Claude 3.5 Sonnet获得了升级。 最为惊喜的是,升级版Claude 3.5 Sonnet不仅在各项性能指标上取得显著提升,更是获得了一项革命性的新技能:能够像人类一样操作电脑。 尽管我们现在几乎每天都能看到AI技术的更新,但这一新突破足以刷新人们的认知,也标志着AI技术在实际应用领域迈出了关键性的一步。    这项功能名为Computer Use(计算机使用),目前处于Beta公测阶段,仅支持开发者通过API配置和调用。网页端的Claude版本虽然已经更新到了Claude 3.5 Sonnet (New),但并没有这项功能。 具体来说,Claude能够通过观看屏幕截图,实现移动光标、点击按钮、使用虚拟键盘输入文本等操作,真正模拟人 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览