注册
登录
专栏名称:
将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
创业家
·
当企业面临灾难,你要抢救什么?
·
2 天前
IPO早知道
·
小马智行张宁:战略规划早已想清楚,IPO后要 ...
·
2 天前
IPO早知道
·
浩博医药AusperBio完成7300万美元 ...
·
3 天前
创业家
·
一个创业者最能成功的状态
·
3 天前
江西日报
·
精彩江西 ...
·
3 天前
江西日报
·
精彩江西 ...
·
3 天前
今天看啥
›
专栏
›
将门创投
同时操控手机和电脑完成任务,CAMEL联合多家机构发布首个跨系统智能体评测基准CRAB
将门创投
·
公众号
·
科技创业
· 2024-08-21 08:22
文章预览
AI 智能体(Agent)是当下大型语言模型社区中最为吸引人的研究方向之一,用户只需要提出自己的需求, 智能体框架便可以调度多个LLMs并支持多智能体(Multi-agents)以协作或竞争的方式来完成用户给定的任务 。目前智能体已越来越多地与大型多模态模型(MLM)相结合, 支持在各种操作系统( 包括网页、桌面电脑和智能手机) 的图形用户界面( GUI) 环境中执行任务 。但是目前针对这种智能体性能评估的基准(benchmarks)仍然存在很多局限性,例如构建任务和测试环境的复杂性,评价指标的单一性等。 针对这些问题,本文提出了一个全新的跨环境智能体基准测试框架 CRAB。 该项目由CAMEL AI社区主导,由来自牛津、斯坦福、哈佛、KAUST、Eigent AI等机构的研究人员合作开发 。CAMEL AI社区开发的 CAMEL框架 ( https://www.camel-ai.org; https://github.com/camel-ai ) 是最早 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
创业家
·
当企业面临灾难,你要抢救什么?
2 天前
IPO早知道
·
小马智行张宁:战略规划早已想清楚,IPO后要继续证明L4大规模商业化的可行性
2 天前
IPO早知道
·
浩博医药AusperBio完成7300万美元B轮融资,加速乙肝治愈疗法AHB-137的全球开发
3 天前
创业家
·
一个创业者最能成功的状态
3 天前
江西日报
·
精彩江西 回眸2024|SVG海报组:江西制造“硬核”出击
3 天前
江西日报
·
精彩江西 回眸2024|SVG海报组:江西制造“硬核”出击
3 天前