专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

ICLR 2025 | 评估大模型智能体的复杂任务规划能力

将门创投  · 公众号  · 科技创业  · 2025-03-12 08:22
    

文章预览

规划(Planning)是大模型智能体的核心能力,广泛应用于大模型的多工具调用、具身智能场景中的复杂任务拆解和多机器人协同、复杂问题的求解、医学场景中的疑难杂症诊断分析,AI for Science中的实验方案设计等。相较于普通的推理能力,规划更加依赖于结构化思维建模(Structure Thinking),而非单一的线性思维过程。研究表明,目前的大模型在规划能力上仍有显著不足,尤其在处理图结构类型的工作流任务时表现薄弱。未来,提升大模型在复杂规划任务中的表现,特别是增强其对图结构任务的理解与规划能力,将是推动智能体广泛应用的关键之一。 论文题目: Benchmarking Agentic Workflow Generation  论文链接: https://arxiv.org/abs/2410.07869 代码链接: https://github.com/zjunlp/WorfBench 大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和An ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览