专栏名称: AI修猫Prompt
专注于生成式AI的Prompt Engineering领域。
今天看啥  ›  专栏  ›  AI修猫Prompt

最新综述:LLM作为法官,用AI评判AI

AI修猫Prompt  · 公众号  ·  · 2024-11-29 06:58
    

文章预览

                                   本文:7100字阅读  18分钟 让AI来评判AI,即利用大语言模型(LLM)作为评判者,已经成为近半年的Prompt热点领域。 这个方向不仅代表了AI评估领域的重要突破,更为正在开发AI产品的工程师们提供了一个全新的思路。 来自 国际数字经济学院、中国科学院计算技术研究所、伦敦帝国理工学院、中国人民大学高瓴人工智能学院的研究者近期发布了一篇关于 LLM-as-a-Judge的 综述,引用146篇论文从应用现状、评估方法到核心提升策略做了非常全面的研究。 我之前介绍过 一篇元法官的自我改进的研究 《 Meta与伯克利最新:元奖励Prompt,让LLM作为元法官能自我改进(包含Prompt模板) 》 ,您也可以看看。 图片由修猫创作 研究者用康德的《判断力批判》和《纯粹理性批判》开篇,它阐述了判断力(Judgment)在认识过程中的功能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览