论文笔记--Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks

作者提出了一个针对多元时间序列数据设计的通用图神经网络框架。通过图形学习模块自动提取变量之间的单向关系。进一步对空间上图卷积层和时间上空洞卷积层进行改进来捕获时间序列中的空间和时间依赖性。

Problem Definition

Challenge: ①在时间序列预测的问题上，目前的GNN方法都依赖于预先定义的图结构。但大多数情况下，多元时间序列没有明确的图结构。变量之间的关系应该从数据种获得。

②即使给定空间上的图结构，给定的图结构未必是最优的，在图学习的过程中，应该在训练过程种不断更新。

解决办法：针对①作者提出了一个图学习层，能够自适应地从数据中抽取稀疏图邻接矩阵。基于学习得到的图邻接矩阵，作者使用图卷积模块进行变量之间空间依赖学习。同时，作者对图卷积模块进行了改进，学习变量之间的单向依赖以缓解图神经网络中的过平滑问题。

针对②图学习层和图卷积模块参数都是可学习的，意味着图结构也是在训练过程中不断优化的。

所以作者提出模型框架图如下。时序数据首先经过图结构学习层，根据学到的图结构做图卷积，再通过改进的一维卷积来捕获时间上的相关性，得到预测结果。

Method

接下来就是作者提出模型的具体结构。一个图学习层，m个图卷积模块，m个时间卷积模块和一个输出模块。图学习层计算一个得到图邻接矩阵，然后将其作为所有图卷积模块的输入。然后图卷积模块与时间卷积模块交叉使用，分别捕捉空间和时间依赖性。输出模块将隐藏的特性投影到所需的输出维度。其中还包含一些残差连接用于避免梯度消失的问题。

然后对各个模块的具体介绍

Graph Learning Layer

如果使用现存的度量节点之间相似性来构建图，例如欧式距离，计算复杂度就是O(n^2)，计算和存储成本随图大小的增加呈二次增长，在大图中将无法使用。

另一个问题是，现有的距离度量通常是双向的，作者认为节点之间的关系应该是单向的，例如交通问题中，一个节点流量变化会使其他的变化，而不是相互影响的关系（我理解就是流量的单向流动的）。所以作者向构建有向的图结构。图学习层是专门为提取单向关系而设计的。具体结构如下

其中E1和E2表示随机初始化的节点嵌入结果，Θ1, Θ2 are model parameters，α为激活函数的饱和率，argtopk(·)返回最大几个值得下标。可以看到公式(3)就是用来实现邻接矩阵得非对称性，通过relu来去除矩阵中得负值，最后达到如果Avu为正数，则对应得对称位置Avu则为0. 公式(4)(5)(6)则是用来减少图卷积时得运算量, 只取其中前K大得值作为邻居, 其他值为0. 同时如果有节点的属性信息可以,使用节点的属性来获得E1和E2.

Graph Convolution Module

图卷积模块的目的是将节点的信息与相邻节点的信息融合，以获得空间依赖关系。图卷积模块由两个mix-hop传播层组成，分别处理通过每个节点的流入和流出信息(例如交通流量中的流入流量,流出流量)。最终将两个信息相加所谓最终的模块输出信息。具体结构如图(a)