专栏名称: 专知

专知，为人工智能从业者服务，提供专业可信的人工智能知识与技术服务，让认知协作更快更好！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

【KDD2024】预训练和提示在文本属性图上的少样本节点分类

专知 · 公众号 · 互联网安全科技自媒体 · 2024-07-28 14:00

主要观点总结

本文介绍了一种针对文本属性图（TAG）的少样本节点分类框架P2TAG。传统的少样本节点分类方法直接在预处理后的节点特征上进行训练，性能依赖于特征预处理方法的选择。而P2TAG通过在TAG上对语言模型（LM）和图神经网络（GNN）进行自监督损失的预训练，并利用混合提示方法进行少样本节点分类。实验结果表明，P2TAG在多个现实世界的TAG数据集上表现优于现有的图少样本学习方法。

关键观点总结

关键观点1: 传统的少样本节点分类方法缺陷

传统的少样本节点分类方法直接在预处理后的节点特征上进行训练，不考虑原始文本，性能高度依赖于特征预处理方法的选择。

关键观点2: P2TAG框架的特点

P2TAG是一种针对TAG的少样本节点分类框架，通过图预训练和提示进行实现。它在TAG上对语言模型和图神经网络进行自监督损失的预训练，并充分利用语言模型的能力。

关键观点3: P2TAG的实验结果

P2TAG在六个现实世界的TAG数据集上进行实验，包括论文引用网络和产品共同购买网络。实验结果表明，P2TAG比现有的图少样本学习方法表现更好，改进幅度为+18.98% ∼ +35.98%。

文章预览

文本属性图（TAG）是一种重要的现实世界图结构数据，每个节点都与原始文本相关联。对于TAG，传统的少样本节点分类方法直接在预处理后的节点特征上进行训练，而不考虑原始文本。其性能高度依赖于特征预处理方法的选择。在本文中，我们提出了P2TAG，一种针对TAG的少样本节点分类框架，通过图预训练和提示进行实现。P2TAG首先在TAG上对语言模型（LM）和图神经网络（GNN）进行自监督损失的预训练。为了充分利用语言模型的能力，我们在框架中适配了掩码语言建模目标。预训练模型随后使用混合提示方法进行少样本节点分类，同时考虑文本和图信息。我们在六个现实世界的TAG上进行了实验，包括论文引用网络和产品共同购买网络。实验结果表明，我们提出的框架在这些数据集上比现有的图少样本学习方法表现更好，改进幅度为+18.98% ∼ +35.98%。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Alibaba Cloud International · 21.3亿次！阿里云支撑总台春晚实现史上最广覆盖！

4 小时前

Alibaba Cloud International · 21.3亿次！阿里云支撑总台春晚实现史上最广覆盖！

4 小时前

人工智能产业链union · 引领科技前沿，塑造卓越品质——半导体晶圆测温产品、去胶机设备与退火炉RTP设备

6 小时前

人工智能产业链union · 引领科技前沿，塑造卓越品质——半导体晶圆测温产品、去胶机设备与退火炉RTP设备

6 小时前

光明网 · 多个热搜刷屏！春晚个别“演员”出现失误？相关人士回应

2 天前

光明网 · 多个热搜刷屏！春晚个别“演员”出现失误？相关人士回应

2 天前

李楠或kkk · 为什么你要搞 7 个 macmini 在本地跑 deepseek-20250129015422

3 天前

李楠或kkk · 要是过年讲段子，那我存货就太多了。这张图也很传神。 -20250128232946

3 天前

知常容 · 健康的股市需要回调，连续两天的大跌就是给新入市的韭零后最好的警戒！

3 月前

小盒子的技术分享 · 如何在服务器上部署开源大模型 GLM-4-9B-Chat 并应用到RAG应用中

3 月前

光明网 · 洗澡请记住一组数字：42，20，5

1 月前

化工365 · 总投资590亿元！内蒙新建大型煤化工项目装置开工

3 周前

龙视新闻在线 · 为何12306显示无票，“抢票软件”宣称有票？

1 周前