大图查询若干关键问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qvodsbsbsbsbsbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图被广泛地应用于各个领域中,例如交通路网、电子通信网络、社交网络、生物信息网络以及协作网络等。图结构中,边表示顶点之间的关系。图上有许多特制的算法,图查询研究一直受到学术界与工业界的广泛关注。随着信息化时代的到来,各种信息以爆炸模式增长,导致图的规模日益增大。如此大规模的数据量,给图查询处理带来了极大的机遇与挑战。
  目前已有的大量图查询算法大多是集中式算法,但随着图数据的指数型增长,传统的索引与查询方法已经不能适用于大图,亟需并行化的解决方法。然而,由于图拓扑结构的复杂性,使得很多图查询处理算法很难并行化以及高效的处理。此外,不同的应用特点需要不同的图数据类型进行建模,但现有的图数据查询处理技术不适用于所有的图模型,因而无法高效地处理不同图类型的查询需求。为此,本文围绕图查询若干关键问题展开了系统而深入地研究,主要包括:
  (1)可达性查询。可达性查询是图上的基本问题,在语义网、交通路网路径规划和生物信息网基因控制等方面有着重要的应用价值。针对大规模图,本文研究了普通图上的分布式可达性查询与受限可达性查询问题。此外,现实世界的图通常带有时态信息,例如在通信网络中,通信的时间时常;在交通信息网络中,航空、火车、汽车时刻表的出发时间和到达时间;而现有的图可达性查询算法已经不适用于时态图。鉴于此,本文还探讨了时态图上的分布式可达性查询。
  (2)顶点相似性查询。图顶点相似性查询是图数据挖掘的基础,在电子商务、社交网络的推荐和专利分析等方面具有广阔的应用前景。鉴于图顶点以及边通常带有多种多样的度量属性信息,且对应的属性相似性计算方法灵活多样,为了使图中各种各样的度量属性信息能够统一表达与计算,本文定义了一种新的图数据类型一类度量图,并展开了类度量图上的顶点相似性查询研究。
  (3)图模式匹配。传统的图模式匹配没有考虑图的时态信息,而时态信息在疾病传染模式检测、社交网络谣言传播、信息扩散以及公共安全犯罪行为侦查方面有着至关重要的作用。因此,本文首次定义了时序相关流图,并基于此研究了时序相关流图模式匹配问题。此外,鉴于真实数据规模越来越庞大且时态图通常分布在多台机器上,本文还探索了分布式时态图上的时序流图模式匹配问题,提出了高效的基于GraphX的分布式时序相关流图模式匹配算法。
其他文献
[db:内容简介]
The recently proposed coprime array, as an example of a sparse array of antennas, could produce more effective virtual sensors (degrees of freedom (DOFs)) than the number of actual sensors being used.
学位
Underwater Acoustic(UWA)Communication uses acoustic waves to transmit and receive data under the water.Underwater radio waves suffer from high attenuation.Optical waves suffer from heavy scattering.Ac
学位
Detection, identification and intelligence are the blistering topics and requirements nowadays in modern era. As artificial intelligence is going to seizure the whole world soon, most of the explorati
学位
汉字是世界上使用最多的文字,汉字识别在残疾人无障碍阅读、文献自动录入、邮件分拣、银行票据处理、证件识别等领域有着重要的应用价值。汉字数量巨大,手写风格各异,并且汉字中存在大量的形近字,导致脱机手写汉字识别一直存在准确率偏低的问题。近年来,深度学习发展迅速,在模式识别、自然语言处理、语音识别等领域都取得了不错的成绩。因此,本文采用深度学习的方法对脱机手写汉字识别进行研究。针对汉字识别大分类问题,采用
图像超分辨率技术是近年来计算机视觉领域的研究热点之一,其可以有效地弥补硬件成像设备精度的不足,以较高的还原度呈现出真实场景。图像超分辨率技术在安防、遥感、医学和高清显示等领域有着广泛的应用场景和需求。本文围绕提高图像超分辨率性能展开研究,并在基于学习的超分辨率方法上从提升学习字典训练效率和提高图像重建质量两个方面进行改进。本文首先针对传统字典训练效率低的问题,提出一种新的图像块相似性判断方法及结构
学位
随着我国新消费时代的到来,消费模式开启了新格局,品质消费备受追捧。受到新消费热潮的影响,生鲜企业也在不断转型升级,生鲜超市等新兴生鲜消费渠道逐渐增长。由于生鲜供应链具有配送成本高、仓储难度大、产品损耗率高等特点,大部分涉足生鲜的企业都处于亏损状态。如何控制供应链成本,对生鲜供应链的选址、库存和路径进行集成优化是尤为重要的。本文正是基于此背景,在研究以超市为代表的现代生鲜供应链体系基础上,综合直送模
学位
聚合博弈是成本仅依赖于其自身策略和关于所有个体的聚合策略的一类重要博弈.其在自然科学、经济学和工程科学等领域中广泛应用.特别的,在工程科学中,无线通信、交通系统、智能电网等方向的聚合博弈问题得到了越来越多富有成效的研究.博弈理论的关键是纳什均衡问题的研究.因此,求解纳什均衡的算法受到了广泛关注.近年来,随着大规模通信网络和分布式技术的发展,很多研究学者致力于分布式纳什均衡算法的研究.相比于传统的集
学位
观察数据中发现变量之间的因果关系,解释事件是如何发生以及预测其未来发展趋势,几乎在所有学科中都有研究和应用。例如医学、生物学、经济学、物理学、社会科学等领域均把因果关系作为解释、预测和决策的基础。信息科学领域,可以使用贝叶斯网络中的马尔科夫毯(边)来表示真实世界中的因果关系。近年来,有学者采用基于回归正则化模型马尔科夫边的发现方法从观测数据中研究事件之间的因果相关性,并从理论上揭示了基于回归正则化
在单机数据上训练的深度学习机制,受限于数据量和算力容易出现过拟合以及较低的可用性等问题。为了解决这个问题,采用中心化的训练架构,聚合多个参与方的数据来训练一个全局模型是普遍采用的模式。或者采用分布式的训练模式,基于中心化服务器聚合各个参与方的模型梯度更新,但这两种中心化的架构始终存在单点故障的可能。此外,当前深度学习系统对于数据隐私和模型隐私的关注不够,限制了深度学习在诸如医疗、金融等敏感数据上的
学位