文章预览
微软正式推出 Windows Agent Arena ,这是一个 开源 基准,可让学术界和业界的研究人员开发、测试和比较适用于 Windows 的 AI Agent 。可以使用相同的应用程序、工具和Web浏览器在 真实操作系统 中评估各种任务的模型。 像Copilot和ChatGPT这样的人工智能助手已经成为数百万用户在工作和家庭中使用的有用工具,它们使用大型语言模型(LLMs)来帮助我们完成从调试代码到头脑风暴、晚餐食谱等各种任务。随着LLMs的能力越来越强,我们应该对我们的 AI助手 有什么期待? 在微软,正在研究开发下一代模型所需的条件,这些模型不仅能推理,还能规划和行动来帮助我们 。他们对AI Agent通过能够预订假期、编辑文档或提交费用报告等方式提高生产力和软件可访问性的潜力感到兴奋。 什么是计算机Agent? 从最广泛的意义上讲,Agent是指能够感知环境、推理并对其采
………………………………