一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
今天看啥  ›  专栏  ›  深度学习自然语言处理

ACL 2024 | GNNavi:用图神经网络引导大模型的信息流动

深度学习自然语言处理  · 公众号  ·  · 2024-07-06 22:34

文章预览

Munich NLP 本文分享慕尼黑大学Prof. Hinrich Schütze 团队与德累斯顿工业大学团队合作的一篇ACL 2024 Findings 长文:《GNNAVI: Navigating the Information Flow in Large Language Models by Graph Neural Network》。该工作受到上下文学习(ICL)中信息流视角的启发,利用标签词作为信息锚点的功能,提出了一种基于图神经网络结构的参数高效微调(PEFT)方法,并通过实验在GPT-2和Llama-2等模型上验证了该方法在效率、表现和解释性方面的优势。 文章链接 (arxiv):  https://arxiv.org/pdf/2402.11709 或点击文末 阅读原文 获取原文链接 数据代码链接 (Github):  https://github.com/ShuzhouYuan/GNNavi 01 背景综述 本文介绍了一种新方法GNNavi,它通过图神经网络(GNN)引导大型语言模型(LLM)中的信息流。大模型在有示例的提示下表现出强大的上下文学习(ICL)能力,但微调对于进一步提高大模型的适应性仍 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览