作者投稿|PROMST：一种自动化优化大语言模型在解决多步骤任务中的提示词框架

SparksofAGI · 公众号 · · 2024-02-18 13:09

文章预览

PRompt Optimization in Multi-Step Tasks (PROMST): Integrating Human Feedback and Preference Alignment PROMST：一种自动化优化大语言模型在解决多步骤任务中的提示词框架 ‍‍‍‍‍‍‍‍‍ ‍‍‍‍‍ 1）本论文提出了一种名为 PROMST (PROmpt Optimization in Multi-Step Tasks) 的框架，旨在建立一种自动化框架来优化大语言模型（LLMs）在解决多步骤任务中的提示词（prompts）。 2）该工作的核心在于，通过引入人类反馈、得分预测模型以及修改评分规则，以优化多步骤代理任务（Multi-Step Agent Tasks）中的提示词。得分预测模型使用小模型来评判大模型，利用了weak-to-strong generalization的思想。该工作还表明了修改评分规则可以使优化以后的prompt更符合人类的偏好(human preference alignment)。 3）PROMST是第一个探究多步任务中动态优化提示词的工作，对未来研究开辟了新方向，并为未来研 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

作者投稿|PROMST：一种自动化优化大语言模型在解决多步骤任务中的提示词框架​

文章预览

作者投稿|PROMST：一种自动化优化大语言模型在解决多步骤任务中的提示词框架