免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

量子位 · 公众号 · AI · 2024-10-29 13:10

文章预览

阿里安全投稿量子位 | 公众号 QbitAI 让大模型能快速、准确、高效地吸收新知识！被EMNLP 2024收录的一项新研究，提出了一种检索增强的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作主要集中在单次或批量编辑上，由于灾难性的知识遗忘和模型性能的下降，这些方法在终身编辑场景中表现不佳。尽管基于检索的方法缓解了这些问题，但它们受到将检索到的知识集成到模型中的缓慢而繁琐的过程的阻碍。而名为 RECIPE 的最新方法，它首先将知识描述转换为简短且信息丰富的连续提示的token表示，作为LLM输入查询嵌入的前缀，有效地细化基于知识的生成过程。它还集成了 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · //@实践笔记007:对于明星/名人数字人，我想每个人都能享受数-20250117214944

11 小时前

量子位 · 国产3D生成大模型火爆外网！歪果仁年都不过了，都在测这个

22 小时前

宝玉xp · //@程序员邹欣://@大红矛:之前东大只说电诈，没提人口贩运。-20250116100037

昨天

爱可可-爱生活 · 晚安～ #晚安# -20250115224905

2 天前

爱可可-爱生活 · 【[78星]Kokoros：用Rust语言实现的超快文本转语音（-20250115173821

2 天前

918云南交通台 · 超全攻略！逛南博会，看这一篇就够了

5 月前

新街派生活报 · 最新消息！即将大降！

5 月前

峨眉峰还独照 · 中金研报：速读80个大A量化因子

11 月前