文章预览
简介 聊天式语言模型 的快速发展在解决复杂任务方面取得了显著进展。然而,它们仍然很大程度上依赖于 人类输入 来引导对话朝着正确的方向前进。这种依赖使用户必须根据自己的意图和聊天代理的反馈提供 相关且准确的提示 。创建有效的提示往往需要对特定领域的知识有深入的理解和专业知识。这可能是具有挑战性、耗时的,并且有时是不可能的。例如一个缺乏交易经验的人,很难指导聊天代理开发一个完整的交易应用程序。 因此,想要走出这个困境需要我们解决这样一个问题: 我们能否用一个能够自主引导对话朝着完成任务的方向发展的通信代理来取代人类干预? 当使用多个代理进行自主合作以完成任务时,会出现 角色偏离、重复说明、敷衍回答以及消息无限循环等 常见问题。因此,重点在于研究这些模型与人类意图对齐的方法,并
………………………………