< 上一个 | 内容 | 下一个 >

6.3.2 图神经网络的基础原理

图神经网络自提出以来,迅速得到了学术和工业界的青睐,成为 AI 研究热点。现实世界中的许多关系都可以描述为图,而在面向图 的任务中,图神经网络这一工具的表现明显优于其他已有的神经网络,因此越来越多的人正在将或是已经将强大的图神经网络应用到了各 个行业、各个领域。此处从以下三个视角对图神经网络展开讨论。

6.3.2.1 谱域视角

基于谱域的图神经网络方法有着坚实的数学理论支撑——图信号处理,其主要思想为将图信号通过图傅里叶变换(Graph Fourier Transform)转换到频域,与滤波器做卷积操作,卷积后的结果再通过逆图傅里叶变换 (Inverse Graph Fourier Transform) 变换回原来的空间。

具体来说,对于一个无向图,首先通过其拓扑结构得到它的拉普拉斯矩阵(Laplacian Matrix)。由于拉普拉斯矩阵本身的特性,它即包含了图的结构信息,又能表示节点之间的关系,因而往往被用于图信号处理领域。对拉普拉斯矩阵进行谱分解后,能够得到一组正交的图傅里叶基。之后,对于图信号,将其投影到图傅里叶基上(即图傅里叶变换)以转换为频谱域的中间值,便能够在频谱域对其进行高效的分析、特征提取和处理,并将这些操作统称为滤波(Filter)。在对中间值进行滤波操作之后,再通过基变换,将其转换回初始的空间(即


逆图傅里叶变换)。将这样的整体操作称为基于频域的图卷积

Spectral-Based Graph Convolution),其中的滤波器则为网络可训练的部分。此外,还可以堆叠多个这样的操作,每一次图卷积操作可以被形象地称作一层图卷积,然后让图信号(即节点的表征)依次按照顺序经过这些图卷积层。在这样迭代的过程中,节点的表征将逐渐包含更多的上下文信息。

6.3.2.2 空域视角

基于空域图神经网络方法的思想则主要借鉴了经典的卷积神经网络CNN。具体来说,在基于空域的图卷积网络中,图中的每个节点都会将表征自身的特征向量向它周围的邻居节点发送,同时接收它的邻居节点传来的特征向量。与基于频域的图卷积层类似,这样的一系列操作被称为基于空域的图卷积层,并且也可以进行多层的堆叠以捕捉更远节点的信息。此外,基于空域的图神经网络相较于基于频域的图神经网络具有一大明显优势:当图或网络中有新加入的节点时,基于频域的图神经网络往往需要重新进行训练,而基于空域的图神经网络往往不需要。

6.3.2.3 消息传递统一框架

从更深的层次来讲,基于谱域和基于空域的图神经网络并不完全是两类不相交的方法,两者可以被统一整合到消息传递统一框架的视角之下。该框架的中心思想为消息传递机制,即每个节点表征聚合来自邻居节点的消息,然后将聚合的消息与其自身表征相结合,对自身表征进行更新。

值得注意的是,消息传递机制的思想与基于空域的图神经网络的思想十分类似,但实际上两者对于网络中“消息”的定义略有差别。为了将基于谱域和基于空域的图神经网络整合到统一的框架之下,主要从以下三个角度剖析:

1)消息的定义:在基于空域的图神经网络中,之前默认节点


之间传递的消息是表征节点的特征向量。但实际上,在基于频域的图神经网络中,经过图傅里叶变换而转换到频域的图信号,也可以被视作消息,并通过频域上的卷积操作进行消息传递。也即消息传递统一框架下的消息是一个更为宽泛的概念,它既包括空域中的消息,也包括频域中的消息。

2)聚合操作:当完成对于消息的统一定义后,不论是基于空域或是基于频域的图神经网络,都可以对目标节点接收到的来自所有邻居的消息进行聚合这一操作,以获取目标节点周围的全局空域或频域信息。一些可用的聚合操作包括但不限于最大池化、平均池化、随机池化等。

3)节点更新操作:已知在空域或者频域下目标节点的表征以及其邻居节点的聚合得到的消息,更新操作旨在根据这两个输入来输出对应的空域或频域下目标节点的新表征。注意对于基于频域的图神经网络,该新表征一般需要通过逆图傅里叶变换回到初始空间。

通过对基于空域和频域的图神经网络三个角度——消息的定义、聚合操作和节点更新操作的剖析,两者可以被整合到消息传递统一框架之下。这样的整合可以使在处理图结构数据时更加灵活,并且能够适应不同的任务和数据特征。