【摘 要】
:
标签图是指节点具有标识能力的一种特殊的图结构,已经普遍应用于地理社交网络、电子商务网络以及生物信息网络等领域的建模。随着科学与计算机技术飞速发展,上述各领域抽象的标签图除具有传统的图数据特点外,又呈现了数据规模巨大、数据增长过快以及数据更新频繁等特点。子图查询因对图数据分析具有重要意义得到了研究者的广泛研究。然而,随着标签图规模日益增大,人们逐渐倾向于只关注众多查询结果中一些高匹配结果,希望借助查
论文部分内容阅读
标签图是指节点具有标识能力的一种特殊的图结构,已经普遍应用于地理社交网络、电子商务网络以及生物信息网络等领域的建模。随着科学与计算机技术飞速发展,上述各领域抽象的标签图除具有传统的图数据特点外,又呈现了数据规模巨大、数据增长过快以及数据更新频繁等特点。子图查询因对图数据分析具有重要意义得到了研究者的广泛研究。然而,随着标签图规模日益增大,人们逐渐倾向于只关注众多查询结果中一些高匹配结果,希望借助查询结果之间的关系以及数量等快速获取期望结果。因而,为了满足用户的个性化查询需求,更具针对性的Top-K兴趣子图查询方法应运而生。研究者考虑到传统的无优化策略的子图查询算法在大规模图中难以应用的弊端,研究借助数据库的索引技术实现对图中节点或边进行索引,或借助图压缩技术缩减数据图规模以加快查询效率。然而,大多数新研究的子图查询算法忽略了现阶段的大部分标签图的数据增长过快以及数据更新过于频繁的特点。同时,在Top-K兴趣子图查询中,多借助边的权值定义实体间的某种限制关系,这导致现有的针对无权图的子图查询算法难以直接应用。因而如何实现在大规模且动态变化的加权标签图上的Top-K兴趣子图查询成为图数据处理过程中研究热点之一。本文针对上述问题展开深入研究,提出了一种适用于大规模加权标签图的动态Top-K兴趣子图查询(Dynamic Top-K Interesting Subgraph Query,DISQtop-K)方法,该方法由离线预处理和在线查询两阶段构成。首先,离线预处理阶段,针对初始的静态标签图在尽可能压缩图规模的同时完成图压缩拓扑结构特性(Graph Compression Topology Feature,GCTF)索引的构建,基于构建的GCTF索引进行图分割,为后续并行查询和将标签相同且相连的多个节点及与其相邻的边的打包过滤奠定基础。其次,在线查询阶段,利用被压缩的节点个数、节点的邻接点标签频率、边的权值以及被同时压缩的边的最大权值等多个因素对各分区的候选集进行过滤,并对经过滤的候选集进行匹配验证和验证结果的连接,极大地提高了子图查询的效率。然后,利用滑动窗口收集的操作记录流,针对初始过滤后的候选集及结果集进行动态修正和对索引进行动态维护,提高了动态查询的效率以及动态查询结果的准确性。最后,在真实数据集和模拟数据集上的大量实验验证,本文提出的DISQtop-K方法通过图压缩和图分割,在一定程度上提高了兴趣子图查询效率,并且在提高动态查询效率的同时提升了动态查询的准确性。
其他文献
最近二十多年来,与超冷分子有关的研究引起了科学家们的极大兴趣,特别是超冷异核极性分子,由于其具有永久固有电偶极矩和各项异性长程偶极-偶极相互作用,使其优于中性超冷原
《塔景亭案牍》记录了许文濬县令在清末民初两个时期担任江苏省句容县正印官期间施政执法的基本情况。对研究清末民初时期我国州县官基层司法状况具有很高的价值。本文以案牍中的庭判为主要研究对象,主要运用归纳的方法来整理研究许县令的审判特点和其解决基层纠纷的方式方法。为化解当下我国的基层纠纷提供一些借鉴。并在一个横截面上反应出清末民初时期江苏省句容县的基层司法状况。本文先从一般角度归纳了庭判中所反映出的许县令
近年来,我国宏观经济增速放缓,金融改革呼声渐高,与银行业息息相关的利率市场化改革提上日程,国内银行业正积极寻求可持续发展道路。随着金融市场的不断完善,金融创新层出不
气候变化显著影响着全球的生物多样性,使得物种生存受到了严重的威胁。制定更为全面有效的物种脆弱性评估体系是生物多样性保护面临的重要挑战。我国落叶阔叶林在水土保持、
在超分子化学发展的历史长河里,研究分子间非共价键的作用力是主要的任务,也是超分子化学的核心竞争力。冠醚作为第一代大环主体化合物经久不衰,一直处于研究的热潮中,丰富的研究成果不计其数。到目前为止,冠醚的研究也已经有多个方向,但是被修饰的水溶性磺化冠醚,尤其是带有负电荷的水溶性磺化冠醚,是一种优良的大环主体化合物。不仅可以可带电荷的客体之间进行键合,还可以进行离子的选择性识别。这一性能被广泛应用于离子
随着超大规模集成电路的发展,单晶硅表面要求具有纳米级面型精度和亚纳米级表面粗糙度,同时保证表面无损伤,这使得硅片抛光技术成为微/纳米制造行业的热点。氧化铈具有抛光速度快、光洁度高和使用寿命长的优点而受到广泛的关注。前期的研究表明圆球形微米氧化铈抛光质量最好,但抛光效率低;八面体形纳米氧化铈抛光质量较低,但抛光效率较高。本论文通过对氧化铈制备参数的调节,来控制其颗粒的尺寸,从而达到抛光效率与抛光质量
我国致密油气藏资源具有巨大的开发前景,是常规油气资源最现实的接替能源。致密油藏衰竭开发过程中,当地层压力低于饱和压力,溶解于原油中的天然气分离出来,目前针对致密油藏
闪电等离子体的放电特征和物理机制等方面的研究内容是目前备受关注的课题之一,温度是反映闪电等离子体放电特性的重要参数之一。迄今为止,关于闪电等离子体的研究通常是在光学观测的基础上进行的。我们小组的成员使用具有高时间分辨率的无狭缝摄谱仪,在青海高原地区拍摄获取了雷电光谱数据,本工作以这些光谱作为研究对象,结合闪电等离子体通道的发光机制,首次针对闪电等离子体建立了碰撞辐射模型。氮离子(NII)谱线500
我国大多数油田逐渐进入高含水和特高含水期,单独使用水驱平均采收率仅有35%左右,仍有大量原油滞留地下,因此三次采油技术近年来在很多油田被广泛应用。三次采油技术主要包括
对羟基苯甲酸酯类化合物作为防腐杀菌剂在食品和日化领域被广泛应用,由于其大量使用且缺乏相应的处理手段,现已在地表水、地下水、饮用水、污水、空气、灰尘及土壤等中可以检