文章预览
构建能够处理多样化任务并在不同环境中自我演化的通才智能体是人工智能界的长期目标。大型语言模型(LLMs)因其通用能力而被视为构建此类智能体的有希望的基础。当前的方法要么让基于LLM的智能体逐步模仿专家提供的轨迹,这需要人类监督,难以扩展并限制了环境探索;要么让智能体在隔离的环境中探索和学习,导致专家智能体的出现,这些智能体在泛化方面有限。在本文中,我们迈出了构建具有自我演化能力的通用LLM基础智能体的第一步。我们确定了三个要素:1)多样化的环境,供智能体探索和学习;2)一套轨迹,为智能体提供基本能力和先验知识;3)一种有效且可扩展的演化方法。我们提出了智能体健身房,这是一个新框架,具有多种环境和任务,支持广泛的、实时的、统一格式的、并发的智能体探索。智能体健身房还包括一个数据
………………………………