专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【AxBench:斯坦福NLP团队开发的Python库,用于评估-20250210133807

爱可可-爱生活  · 微博  · AI  · 2025-02-10 13:38
    

文章预览

2025-02-10 13:38 本条微博链接 【AxBench:斯坦福NLP团队开发的Python库,用于评估大型语言模型(LLM)可解释性方法的实用性。亮点:1. 提供16K概念训练数据,助力模型精准理解;2. 包含10+种可解释性方法,涵盖微调和提示基线;3. 支持LLM-in-the-loop训练,生成数据成本低至0.01美元/概念】 'AxBench: a scalable benchmark that evaluates interpretability techniques on two axes: concept detection and model steering.' GitHub: github.com/stanfordnlp/axbench #大型语言模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览