如何通过In-context learning，让小模型去学习大模型？

深度学习与NLP · 知乎回答 · AI · 2024-06-12 12:47

文章预览

来源 | 专知近年来，基础语言模型（LMs）在自然语言处理（NLP）和计算机视觉（CV）领域取得了显著成就。与传统神经网络模型不同，基础语言模型通过在大量无监督数据集上进行预训练，获得了丰富的常识知识，并且具有强大的迁移学习能力。然而，由于灾难性遗忘，基础语言模型仍然无法模拟人类的持续学习能力。因此，各种基于持续学习（CL）的方法被开发出来，以改进语言模型，使其能够在适应新任务的同时不遗忘以前的知识。然而，现有方法的系统分类和性能比较仍然缺乏，这正是本综述旨在填补的空白。我们深入综述、总结并分类了现有文献中应用于基础语言模型的持续学习方法，如预训练语言模型（PLMs）、大语言模型（LLMs）和视觉-语言模型（VLMs）。我们将这些研究分为离线持续学习和在线持续学习，其中包括传统方法、基于参数 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新智元 · 抛弃OpenAI，Figure亮王牌：史上首次两个机器人「共脑」，网友直呼太恐怖！

11 小时前

科技阿水 · 无限制可用的DeepSeek-R1满血版，享受飞一般的感……

昨天

科技阿水 · 无限制可用的DeepSeek-R1满血版，享受飞一般的感……

昨天

爱可可-爱生活 · 【PaliGemma 2 mix：Google推出的多任务视觉语-20250220191100

昨天

爱可可-爱生活 · [LG] A Survey of In-Context Rei-20250220060630

昨天

新智元 · 英伟达一夜回血！马斯克狂烧30亿GPU给老黄续命，10倍算力创Scaling Law神话

2 天前

勇汽水 · #天津博物馆·河上花#天津博物馆藏清·虚谷杂画册虚谷（1823--20240705001423

7 月前

市值风云 · 保险资金重仓股追踪（二）：连续多个季度大比例持仓这些个股

4 月前

中色股份NFC · 中国有色金属建设股份有限公司2025年校园招聘开启

4 月前