专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

为什么多模态基础智能体是下一个必争之地？清华发布全新评测基准VisualAgentBench

PaperWeekly · 公众号 · 科研 · 2024-08-22 23:55

文章预览

©PaperWeekly 原创 · 作者 | 刘潇单位 | 清华大学研究方向 | 基础模型，基础智能体背景：从“基础模型”到“基础智能体” 基础模型，特别是大规模预训练语言模型，展现出超出人们预期的通用能力，可以通过提示（Prompting）和微调（Finetuning）实现在特定语言任务上的良好表现。更令人兴奋的是，通过允许基础模型与真实世界、环境甚至其他模型产生交互，我们发现了这类大模型涌现出作为智能体的潜力。LLM-as-Agent 这一领域也在过去一年多来产生了巨大的进展，成为基础模型研究中的一个重要分支。去年 8 月，笔者和合作者一起完成了 AgentBench 这一工作，成为了首个系统评估 LLM-as-Agent 能力的评测基准，得到了许多关注。从 AgentBench 发布一年来，基础模型和智能体领域都发生了翻天覆地的变化。在基础模型领域，一个尤其重要的进展是多模 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

小张聊科研 · 国自然申请|研究科研热点“乳酸化”，国内外研究进展梳理

12 小时前

PaperWeekly · 让CLIP更加精简！字节豆包大模型团队首创无文本编码器方法，高效提速不掉点

2 天前

YND科研绘图 · 科研绘图丨碳催化

2 天前

科研大匠 · 耿美玉团队最新论文，揭示国产阿尔茨海默病新药GV-971靶向肠道细菌的治疗机制

3 天前

红星新闻 · 曾引发全球轰动！称发现“首个室温超导体”的美国教授被开除，校方发布声明

3 天前

红星新闻 · 曾引发全球轰动！称发现“首个室温超导体”的美国教授被开除，校方发布声明

3 天前

销售老司机 · UGG平替找到了！保暖、防滑、高颜值皮绒拖鞋，59.9买一送一！！

1 周前