图卷积及其在链接预测的应用

来源 :宁波大学 | 被引量 : 0次 | 上传用户:wuxinxinwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,数据呈现出爆炸式的增长,许多有应用价值的信息蕴含在冗余繁杂的数据当中,如何充分挖掘这些数据,一直都是计算机领域研究的热点问题。同时,由于人的社会性,图会随着时间的推进呈现出一定的演化趋势,这为问题的解决增加了一定的难度。近年来,基于图卷积的数据挖掘引起了研究者的广泛关注,图卷积是卷积神经网络在图上的扩展,它不仅能提取深层次的特征,还保留了卷积网络权值共享的优点,降低了模型的时间复杂度。因此,本文将以图领域经典问题链接预测为例,分别在静态图和动态图上,研究基于图卷积的链接预测问题。本文的主要工作如下:(1)针对静态图的链接预测问题,本文提出了基于对抗图卷积的链接预测模型(Link Prediction Model Based on Adversarial Graph Convolutional Network,LPAGC)。由于大部分的链接预测模型,不仅要求观测的链接数量足够多,还缺乏对图的整体性的考量。因此,本文综合考虑训练数据和测试数据之间的领域差异性以及邻接矩阵的稀疏性,在输入上,本文模型首先利用相似性度量的结果去填充初始的邻接矩阵,然后采用对抗训练的方式缩小正负样本的差距,以期望达到解耦链接信息和潜在特征的目的。在Cora、Citeseer、Pubmed上的实验结果显示,基于对抗图卷积的链接预测模型比基准模型提高了2.4%、3%、2.7%的AUC值和1.4%、1.7%、2.3%的AP值。在Reddit、PPI上的实验结果表明LPAGC具有一定的泛化性。在不同稀疏度下的实验结果表明LPAGC比基准模型更加稳定。(2)针对动态图的链接预测问题,本文在基于时间快照的动态图数据上,提出了动态图链接预测模型(Link Prediction Model for Dynamic Graphs,LPMDG)。目前大部分动态图的链接预测模型在时间维度上对节点是孤立考虑的,无法在时间和空间上进行有效的统一。因此,本文通过去除链接信息构造负样本,并利用最大化准则去优化模型以获取当前时刻图的全局信息即空间特征,并且将全局特征作为长短期记忆网络(Long Short-Term Memory networks,LSTM)[1]的输入,然后利用宽平稳随机过程对模型进行约束,保证模型去捕获时域上的共性特征。在UCSB、SBM、AS上的实验结果显示,本文的动态图链接预测模型比基准模型提高了1.9%、6.1%、5.0%的AUC值,并降低了0.04、0.12、0.11的RMSE值。在不同时间窗口和潜在空间维度的实验表明,窗口大小和空间维度存在最优组合并不是越大越好。
其他文献
光纤通信技术的快速发展让人类社会迅速进入了高速信息时代,对诸如波长转换器、光开关等无源非线性器件的要求以及需求量也随之得到了极大的提升,而寻找具有较高三阶非线性性能的材料是非线性器件广泛应用的重点之一。在众多可制备成光纤的材料中,硫系玻璃具有高的线性折射率(n0)与非线性折射率(n2),超宽的红外透过范围,低声子能量等优势,是全光开关、光频梳等红外非线性光子器件的理想候选者。本文中利用熔融淬冷法制
学位
如今,2μm超短脉冲光纤激光正朝着高强度和窄脉宽的方向发展,采用啁啾脉冲放大的方式来实现超短脉冲激光峰值功率的极大提升是当前的主流技术之一。脉冲展宽器是啁啾脉冲放大系统中的重要器件,尽管目前空间型2μm波长脉冲展宽器发展已相对成熟,但在如今追求全光纤化激光系统的趋势下,材料和光纤是依然是目前限制2μm全光纤系统的关键因素。经过特殊结构设计的石英光纤展宽器虽使用方便,但是单位长度的光纤提供的色散量相
学位
硫系光纤因其中远红外波段出色的透过特性,使其在红外激光光电对抗、光纤传像束、激光医疗等诸多领域具有巨大的应用潜力。其中以单模硫系光纤最受关注,这是由于单模光纤中只传输基模,光强分布接近于高斯分布,并且无模间色散,在长距离的激光传输和光束控制方面存在巨大优势。人们追求高质量单模硫系光纤的脚步从未停止过,但是受成型工艺条件限制,光纤制备过程中引入的材料或结构缺陷始终影响着光纤的整体性能。因此,亟需提高
学位
基于视觉的同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术是当前机器人导航、自动驾驶等领域的研究热点,但是目前视觉SLAM的研究大多为基于静态环境下的假设,当场景中出现动态物体时,系统的精度和鲁棒性则难以保障,此外,构建出的地图往往会有移动物体重影。针对以上问题,本文在经典的ORB-SLAM2基础上,研究并设计了一种面向动态物体场景的视
学位
推荐系统作为解决“信息过载”问题的有效方法,推动了包括电商在内的众多领域的发展,序列推荐作为其中一类重要的方法,旨在建模用户动态行为偏好,预测其下一次可能的交互行为。近年来,基于各类深度学习方法的序列推荐算法喷涌而出,极大提升了推荐系统的推荐效果。现有序列推荐算法仅从项目间相对时序关系中挖掘项目间的关联,忽略了其真实交互时间信息的探索与利用;此外,该类算法还存在项目间高阶复杂关系挖掘不充分、辅助信
学位
随着网络规模的剧增,高速、无线、数据中心、卫星网络的逐渐普及,用户对网络的需求越来越多,而用户的需求使得应用趋于多样化、复杂化,这给TCP的传输质量带来了较大挑战。拥塞控制算法作为TCP的重要组成部分,对其性能有着较大的影响。低优先级拥塞控制算法主要承载大文件传输、应用更新等的非交互应用流,此类应用常常以背景流的形式存在于网络中,能够有效改善交互式实时性应用流的传输性能。然而在实际的网络中,低优先
学位
传统语音分离算法的数学建模有很大的局限性,导致其在复杂环境下,比如低信噪比和非平稳噪声等情况下,语音分离效果不理想,无法满足各种实际场景中的应用。而基于深度学习的语音分离算法通过对带噪语音信号与目标语音信号之间的非线性映射关系进行学习训练,因而能够极大的改善在复杂环境下的语音质量。本文主要通过充分利用门控循环单元网络(Gated Recurrent Unit,GRU)的结构优势来提高语音分离的性能
学位
近年来,视网膜疾病是最重要的公共健康问题之一。分析视网膜图像中丰富的病变信息对预防和诊断相关的视网膜疾病有着重大意义。视网膜血管的形态特征如角度、分支、长度、宽度和曲折度在分析视网膜图像的各种特征中有着关键作用,因此对视网膜血管的准确分割非常重要。然而即使经验丰富的专家通过手动方法对视网膜图像进行血管标注也是容易出错并且耗时的,因此,建立模型准确地自动分割血管至关重要。此外,一幅合格的视网膜图像是
学位
生成对抗网络是一种无监督学习的深度学习模型,已广泛地应用于人脸合成、图像风格迁移、图像修复、高分辨率图像生成等计算机视觉领域。但是传统的生成对抗网络无法完成训练集较小的生成任务,而结合半监督学习的生成对抗网络不仅可以扩充训练样本量,而且能增强模型的鲁棒性。中国书法是中国的特色文化艺术,是中华民族的象征性符号。在书法漫长的演变岁月里留下过很多精彩绝伦的书法作品,然而这些作品中保存下的书法汉字十分有限
学位
深度学习在语音识别领域的快速发展,使得语音识别系统的准确性和实时性得到了巨大的提升。近年来,市场上涌现出了类型种类众多的智能语音产品,例如带语音助手的智能手机和具有语音控制功能的智能家居等。近年来有研究表明深度学习容易遭到对抗样本的攻击,误导语音识别系统做出错误的翻译或攻击者指定的翻译,且此类攻击很难被人类察觉。尽管如此,对抗样本的研究也有助于提高深度学习的安全性。目前的语音识别领域的对抗样本攻击
学位