文章预览
GraphStore & FeatureStore 技术分享 1.引言 图结构数据由两种类型的数据组成: 图拓扑:图中的节点以及它们之间的连边 节点和边的特征:对应于图中节点和边的属性的密集向量 GNN使用图结构数据进行训练,当图数据过大时,通常需要用采样的方式获得mini-batch,在mini-batch上进行训练。但是mini-batch训练仍然需要将图拓扑和特征放在内存上,无法扩展到规模比内存大的图。因此,想要将GNN扩展到超出单台机器内存要求的大规模图,需要将图拓扑和特征移出内存。 2.GraphStore & FeatureStore 将图拓扑和特征移出内存的一种方案是将图数据存入数据库,通过与数据库交互提取图拓扑和相应的特征。GammaGL通过 GraphStore 和 FeatureStore 接口来实现这个功能,GraphStore 存取图拓扑,FeatureStore 存取节点特征。 通常情况下图数据中特征的数据量往往比图拓扑大好几个数量级
………………………………