文章预览
一、业务背景 在物流私域体系构建中,形成了多个微信群生态,需要投放自动回复机器人来自动化回复用户问题,希望能够用最小的成本满足基本问答。由于需要从头开始自建全流程算法问答体系,需要面临一下几个问题: 1. 数据不外流:用户数属于隐私数据,不可以直接调用外部API接口,防止数据泄露。 2. 回答准确:用户提问各种各样,需要精准匹配用户问题,避免“答非所问”。 3. 大模型幻像:面对直接ToC业务,尽可能避免大模型产生“幻觉”,机器人已读乱回容易为公司招致法律风险。 二、技术方案 1. 项目背景: 当前现有数据为业务方提供的200+条左右的问答数据,我们需要根据用户的query来匹配问答库中最相似的知识,并整合成标准回答,返还给用户。整理流 程分为召回,精排,改写,总共三个过 程。 2. 技术细节 (1)数据清洗 业务
………………………………