今天看啥  ›  专栏  ›  深度学习与NLP

如何评估LLM?

深度学习与NLP  · 知乎回答  · AI  · 2024-06-28 11:43
    

文章预览

论文题目 :Interactive Evolution: A Neural-Symbolic Self-Training Framework For Large Language Models 论文地址 : https:// arxiv.org/abs/2406.1173 6 项目地址 : https:// github.com/xufangzhi/EN VISIONS 1 引言 大语言模型(Large Language Model, LLM)在以自然语言为核心的任务上取得了卓越的性能。LLM的成功依赖于大量可获得的人类标注数据作训练,这些数据主要由自然语言(Natural Language,NL)构成。受益于LLM出色的基础能力与NL数据收集的便捷性,LLM在NL-centric场景中的自我训练、自我增强是相对容易的。 为了拓展LLM的能力边界及应用范围,很多研究者将目光聚焦于神经-符号(Neural-Symbolic)场景。例如,对于web agent网页浏览场景,给定NL的任务描述x,agent需要 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览