论文部分内容阅读
深度学习发展迅猛,已应用于各个领域,无论是对声音数据、图像数据还是文本数据都获得了一定的成效。但由于图数据的特殊性,想要在图数据上使用深度学习方法并不轻松。大规模的图结构信息越来越广泛存在于各个领域,近年来将深度学习应用于图的研究也逐渐增加,从而在图分析方面的技术有了显著的进步。对于图嵌入和网络表示技术来说,当前存在的许多方法都将图结构中的节点表征为一个低维空间中的点向量,然而这样做会有一个局限性,即会损失掉表征的不确定信息。在一个复杂的图中,仅用一个低维点向量描述图中的节点时,不确定性是固有的。Graph2Gauss算法表征图的节点为一个完整的高斯分布,从而捕获到表征的不确定信息。本文主要研究如何更有效地将节点表征为高斯分布。首先,本文提出了基于Wasserstein距离的G2G算法改进。Graph2Gauss算法将图结构数据的节点嵌入为一个高斯分布,在隐藏空间中使用KL散度度量高斯分布之间的距离。严格来说,KL散度其实并不能作为一个衡量距离的指标。从KL散度的形式上看,KL并不具有对称性,且不满足三角不等式。进一步,在隐藏空间中度量对应图中节点的距离,不能保持图的传递性。然而传递性对于图和网络来说是非常重要的特性之一。本文在将图中的节点表征为高斯分布时,使用Wasserstein距离度量分布之间的距离。不同于KL散度,Wasserstein距离满足包括对称性和三角不等式等特性,这使得Wasserstein距离能够成为一个测量距离的指标,其中满足三角不等式,保证了Wasserstein距离能够使节点保持传递性。因此,Wasserstein距离非常适合作为测量隐藏空间内两点的指标。通过在五个真实数据集上的实验对比我们发现,本文提出的方法能够获得领先的效果,证明了算法的有效性。其次,考虑到嵌入空间中高斯分布的一般性,本文提出了基于Householder Flow的G2G算法改进。Graph2Gauss算法在表征图中节点为高斯分布时,只关注了隐藏空间中高斯分布的对角协方差形式,这样可以在一定程度上降低计算复杂度,但同时使得隐藏空间中的高斯分布缺少了一般性,不能足够灵活去匹配真实的后验。由于隐藏空间分布形状的限制,使得Graph2Gauss算法不能够完全的表达和匹配真正的后验分布。因此为了提高隐藏空间中分布的准确性,丰富生成分布成为了一种思路。本文提出使用Householder Flow泛化隐藏空间中的高斯分布。在多个数据上的对比实验结果验证了我们基于Householder Flow的G2G算法的有效性。