主要观点总结
文章介绍了平安科技提出的基于大型语言模型的计划型对话代理框架PCA,该框架具有可控性和主动性,并需要较少的人工注释。文章详细阐述了PCA的实现原理,包括离线规划和在线规划,以及数据集构建方法和实验评估结果。此外,文章还介绍了任务定义、数据创建和建模等方面的研究进展。
关键观点总结
关键观点1: PCA框架介绍
基于大型语言模型的计划型对话代理框架PCA,结合了先进的大型语言模型的上下文学习,具有低成本和高可控性,有望成为下一代企业级对话系统。
关键观点2: 数据集构建
提出了一个半自动对话数据创建框架和高质量对话数据集PCA-D的创建方法,包括定义任务、规划任务SOP、创建对话场景和生成实际对话等步骤。
关键观点3: 实验评估
通过对模型进行自动评估和人类评估,发现PCA框架在提高对话的可控性、主动性和任务成功率等方面表现优秀。
关键观点4: 关键技术和方法
介绍了PCA框架中的关键技术和方法,包括SOP预测、对话生成、LLMs的使用、MCTS计划等。
文章预览
“ Planning with Large Language Models for Conversational Agents ” 智能客服已经经过多年的发展,目前的方案主要还是基于传统深度学习技术加构建知识库的方式建设。近年来大模型快速发展,但是由于大模型的幻觉和输出不可控等问题,目前仍未在企业大量投产。 近日平安科技提出了 基于大型语言模型的计划型对话代理框架PCA, 基于先进的大型语言模型的上下文学习,具有低成本和高可控性,有望成为下一代企业级对话系统。 论文地址 :https://arxiv.org/abs/2407.03884 摘要 本文提出了一种基于大型语言模型的计划型对话代理框架(PCA),该框架具有可控性和主动性,并且需要较少的人工注释。在对话之前,LLM离线计划对话的核心和必要SOP。在对话期间,LLM在线计划最佳行动路径,并生成响应以实现过程可控性和主动性。 同时,作者提出了一个半自动对话数据
………………………………