文章预览
点击上方 蓝字 关注我 本文:6500字阅读 15分钟 上个月介绍DSPy时就有这么一个感觉,Prompt优化领域都卷成这样了,应该很快会有和梯度相关的Prompt优化技术被发出来,并且会超越DSPy。这个周末,这个优化技术验证了我的预想。GRAD-SUM:这是一种可扩展、灵活的自动prompt优化方法,基于梯度汇总,性能超越DSPy,或许它将彻底改变prompt工程的游戏规则。 图片由xiumaodalle生成 DSPy是目前最流行的prompt优化工具之一,自今年爆火以来,各种提示词优化测试位居榜首。但 GRAD-SUM 实验结果的性能提升令人震撼!与DSPy的对比,来自伽利略技术公司的研究者 在所有测试场景中 进行了详细的对比实验, GRAD-SUM都显著优于DSPY: 小学数学问题GSM8k:GRAD-SUM 0.82 vs DSPY 0.755 复杂数学问题Orca Math:GRAD-SUM 0.575 vs DSPY 0.455 检索问答任务Neural Bridge RAG:GRAD-SUM 0.915 vs DSPY 0.885
………………………………