大语言模型何时需要检索？UCLA提出全新自监督选择性检索策略

人工智能学家 · 公众号 · AI · 2024-06-07 18:14

文章预览

来源：PaperWeekly 作者：吴迪单位：UCLA 研究方向：自然语言处理前言最近一年开始做知识增强语言模型的方向。暑假去到了 AWS AI 的 CodeWhisperer 组实习，在 repository-level code completion 这个任务上进行了一些相关研究，有了一些发现，也投中了一篇 ICML Oral，便把感悟写成此文，希望大家多批评指正。背景 2.1 检索增强语言模型（Retrieval Augmented Language Models, RALMs）一般来说，只要语言模型在推理阶段使用了外部知识，就可以被叫作检索增强语言模型。 https://acl2023-retrieval-lm.github.io/slides/3-architecture.pdf 上图截取自 ACL 2023 的 tutorial [1]，我认为可以大致代表 NLP 社区对 RALM 最普遍的认识。可以看到这里的外部知识大多都是非结构化的知识，比如实体或者大段的文本。然而把知识提供给模型的方式和粒度是多种多样的，比如 kNN-LM [2] 是在最终预测的 token 层 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【SwiftSketch：一款基于扩散模型的图像转矢量草图生成工-20250222150435

昨天

爱可可-爱生活 · LServe 创新性地提出了混合稀疏注意力机制，通过统一块稀疏框-20250222055225

昨天

新智元 · 最恐怖没脸机器人觉醒，白天拖地半夜上吊吓哭网友！新鲜尸体绝望抽搐太惊悚

2 天前

新智元 · 抛弃OpenAI，Figure亮王牌：史上首次两个机器人「共脑」，网友直呼太恐怖！

2 天前

中国人工智能学会 · 学会通知丨2024年度吴文俊人工智能科学技术奖奖励公告

2 天前

张雪峰老师 · 东北第一所公办职业本科大学——长春汽车职业技术大学#张雪峰老师#-20240615180000

8 月前

dotNET跨平台 · 一款基于.NET8开源的通用管理平台，支持模块化、WinForms 和 WPF

3 月前