大语言模型的可解释性综述

大语言模型和具身智体及自动驾驶 · 公众号 · · 2024-05-23 00:38

文章预览

23年9月来自多所大学学者（来自美国和中国）的综述论文“Explainability for Large Language Models: A Survey“。添加图片注释，不超过 140 字（可选）摘要：大语言模型（LLM）在自然语言处理方面表现出令人印象深刻的能力。然而，内部机制仍然不明确，这种缺乏透明度的做法给下游应用带来了不必要的风险。因此，理解和解释这些模型对于阐明其行为、局限性和社会影响至关重要。本文介绍可解释性技术的分类法，并给解释基于Transformer语言模型的方法做了结构化概述的总结。根据LLM的训练范式进行分类：传统基于微调范式和基于提示范式。对每个范式，无论生成单个预测的局部解释，还是整体模型知识的全局解释，把目标和主要方法进行总结。还讨论用于评估生成解释的指标，并讨论如何利用这些解释来调试模型和提高性能。最后，与传统机器学习 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

三峡小微 · 沿着总书记足迹迈向高质量发展｜向新而行向海而兴

昨天

三峡小微 · 国庆节的别样“打开方式”

昨天

左右为篮 · 突发！R.I.P. 穆大叔！

5 天前

左右为篮 · 伤心到失语！三方，1换4，太惨了...

1 周前

锂电江湖 · 【JH-7669】A股锂矿行业2024年中报梳理分析：锂矿行业拐点将至？

3 周前

大河票务网 · 屹立华人歌坛近三十年——潘美辰！2024「回家」演唱会正式起航！我想有个家~

1 周前