专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
目录
相关文章推荐
今天看啥  ›  专栏  ›  AINLP

ACL 2024 | GNNavi:用图神经网络引导大模型的信息流动

AINLP  · 公众号  ·  · 2024-07-06 20:30
    

文章预览

本文分享慕尼黑大学Prof. Hinrich Schütze 团队与德累斯顿工业大学团队合作的一篇ACL 2024 Findings 长文:《GNNAVI: Navigating the Information Flow in Large Language Models by Graph Neural Network》。该工作受到上下文学习(ICL)中信息流视角的启发,利用标签词作为信息锚点的功能,提出了一种基于图神经网络结构的参数高效微调(PEFT)方法,并通过实验在GPT-2和Llama-2等模型上验证了该方法在效率、表现和解释性方面的优势。 文章链接 (arxiv):  https://arxiv.org/pdf/2402.11709 或点击文末 阅读原文 获取原文链接 数据代码链接 (Github):  https://github.com/ShuzhouYuan/GNNavi 01 背景综述 本文介绍了一种新方法GNNavi,它通过图神经网络(GNN)引导大型语言模型(LLM)中的信息流。大模型在有示例的提示下表现出强大的上下文学习(ICL)能力,但微调对于进一步提高大模型的适应性仍然至关 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览