今天看啥  ›  专栏  ›  SparksofAGI

作者投稿|PROMST:一种自动化优化大语言模型在解决多步骤任务中的提示词框架​

SparksofAGI  · 公众号  ·  · 2024-02-18 13:09

文章预览

PRompt Optimization in Multi-Step Tasks (PROMST): Integrating Human Feedback and Preference Alignment PROMST:一种自动化优化大语言模型在解决多步骤任务中的提示词 框架 ‍‍‍‍‍‍‍‍‍ ‍‍‍‍‍ 1)本论文提出了一种名为 PROMST (PROmpt Optimization in Multi-Step Tasks) 的框架,旨在 建立一种自动化框架来优化大语言模型(LLMs)在解决多步骤任务中的提示词 (prompts)。 2)该工作的核心在于,通过 引入人类反馈、得分预测模型以及修改评分规则 ,以优化多步骤代理任务(Multi-Step Agent Tasks)中的提示词。得分预测模型使用小模型来评判大模型,利用了weak-to-strong generalization的思想。该工作还表明了修改评分规则可以使优化以后的prompt更符合人类的偏好(human preference alignment)。 3)PROMST是第一个 探究多步任务中动态优化提示词 的工作,对未来研究开辟了新方向,并为未来研 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览