基于高阶结构嵌入与复合池化的图分类模型

来源 :山东大学 | 被引量 : 0次 | 上传用户:Vivian496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图分类是图挖掘领域的重要研究方向之一,被广泛应用于许多实际领域。现实世界中的常见数据,如社交网络、城市交通网络、化学分子网络等,通常可以表示为图结构。基于图结构数据的分类任务在生活中有诸多应用,如判断化学分子结构的理化特征,将蛋白质分子结构用于新药发现等。因此,利用现有神经网络模型实现准确图分类具有重要意义。近年来,图神经网络在节点分类和链接预测等方面取得了很好的进展。在图中,除节点包含大量特征信息外,由两个及以上节点构成的节点集合所表示的高阶结构也具有丰富的语义信息,如化合物分子中的官能团对分析整个分子的性质有重要作用。然而,在利用图神经网络实现图分类时,一般方法是为图中的每个节点生成嵌入表示,然后将这些节点嵌入全局聚合起来,作为图的特征。这种方法存在两点局限:一是仅使用图中顶点和边的信息用于分类,缺乏对高阶图结构信息的关注;二是模型缺乏层次结构,自然构成的网络结构本身就是由单个节点互相关联而成,其中蕴含了大量的结构语义,以分层的方式学习图的表示对于捕捉图中存在的局部结构非常重要。为了开发出有效的图分类模型,需要充分利用图结构固有的丰富信息以及包含在图节点和边上的特征信息。针对上述问题,本文提出了基于高阶结构嵌入的图分类模型和融合复合池化的特征增强模型。在图数据的处理过程中,首先使用增量式的卷积操作,通过逐阶聚合高阶结构信息,并在层次化模型中使用新的复合池化机制,针对池化后的子图节点,根据节点特征和高阶结构信息综合得出一个子图的重要度得分,从而保留多阶结构上的语义信息,最终得到更加完整的最终特征表示。本文的创新点如下:(1)高阶结构嵌入模型可以有效利用图的结构信息,处理给定图的简单和复杂多元结构以及它们之间的关系。利用高阶结构的关键在于它们直接在子图之间传递消息,而不是在单个节点之间传递,这种高阶形式的消息传递可以捕获节点级别不可见的结构信息;(2)设计新的池化机制,在复合池化过程中同时考虑子图特征信息和图拓扑信息来决定被保留的节点,对于选择池化子图后的特征生成,使用特征融合以确保池化子图的特征表示包含来自图的充分有效信息;(3)进一步的,提出融合高阶结构嵌入与复合池化的图神经网络模型,来处理图分类问题,并在常用基准数据集上验证了模型效果,通过消融实验分别对高阶结构嵌入和复合池化的作用进行了分析与验证。此外,与已有方法相比,在公开的图分类数据集上的实验结果表明,融合了复合池化的特征增强算法在分类效果上具有明显优势,能够更好在实际分类任务中发挥作用。下一步研究工作,可以针对现实中不同领域图数据进行研究,推动图分类在各个专业领域的落地。
其他文献
股票预测是指对股票具有深刻了解的研究人员根据股票行情的发展进行的对未来股票趋势方向以及涨跌程度的预测行为。然而,由于股票市场的高度波动性和非平稳性,极大增加了股票预测的难度。新闻媒体信息的爆炸式增长以及自然语言处理和文本挖掘技术的不断发展为股票预测的进一步研究提供了新思路,使研究者能够从众多的新闻媒体信息中揭示市场趋势和波动性。在现有的基于新闻文本的股票预测方法中,大多数方法主要以单一新闻信息(如
学位
大学教育中的语文教育是多方面、多样性的综合体,素质教育也是培养大学生的重要内容,不仅要把思政融入到教学中,更要突出表现大学生自身的特点。大学语文课程是一门重要的基础性学科,是以围绕人文教育开展的核心课程,充分利用语文课堂这一途径,发挥学科特长,将思政教育有效结合,推动大学语文教学改革,以达到以德树人的根本目标。课程思政教育下的大学语文课堂要获得良好的学习效果,需要教师不断地提高自身能力,还需要学校
会议
随着物联网的不断发展,物联网设备的数量和种类正在急速增加。物联网设备应用十分广泛,有一部分物联网设备无法使用传统的电池或电源进行供电,因此需要用到能量收集技术。能量收集就是通过收集物联网设备周围的微小能量(例如太阳能、风能等),从而达到维持自身系统对电能的需求。能量收集可以为不方便使用传统供电方式的物联网设备供电,保证物联网设备的运行。但是,由于能量收集设备的能量输出通常很弱且不稳定,因此物联网设
学位
标签割问题是定义在标签图上的一类经典的组合优化问题。标签图由顶点集、边集、标签集以及边集到标签集的映射组成。在算法研究中,标签割问题是一般图上对应优化问题的推广;在实际应用中,标签割问题被用来衡量共享风险链路网络的健壮性等。最小s-t标签割问题是标签割问题中的基本问题,其目标是在标签图上求一个最小标签子集,使得在图上删除该子集对应的边集后,s点和t点不再连通。最小s-t标签割问题,一方面,是最小s
学位
分子对接是在药物发现过程中一种被广泛使用的计算方法。它通过计算机模拟的方式在受体蛋白质的结合位点中对类药小分子进行姿态定位、评分、排名,以选择出优先用于后续实验测试的化合物,这一过筛选过程将极大地提高后续实验的成功率从而减少时间和经济成本,因此计算机模拟分子对接在药物设计与研发流程中作用重大。在新药研发过程中,对某一特定受体可能需要在数十亿类药小分子中搜索较优的小分子及其与受体蛋白结合的姿态。因此
学位
开源代码平台为科研人员提供了分享和交流代码的环境,近几年,深度学习在自然语言处理、计算机视觉、生物计算等科研领域取得了很大成功,越来越多的深度学习模型和代码在开源平台分享。针对特定问题,研究人员有必要查找相关解决方案,将可复用代码进行对比和性能分析,但现有系统在代码检索和对比方面很少关注算法描述中的专业词汇、函数调用结构等技术特征。为此,本课题改进了基于通用文本的关键词抽取方法,更好地融入反映代码
学位
在现实世界的光照环境下,许多材质有着高频变化的外观光泽闪烁现象。这种现象的成因在于:物体表面上无数微观结构中的一部分形成了完美镜面反射或折射,将尖锐的强烈光源入射到这些微观结构位置上的光线所携带的能量较大比例地散射到观察位置,被人眼观察到。在高度真实感渲染领域里,高精细程度的表观细节材质模型对于提升场景的真实感起到至关重要的作用。传统的材质模型容易使画面变得“油腻”、单调或亮度不正确。而优秀的金属
学位
以群组形式组织和参与活动成为当前移动社交应用的流行趋势,推荐系统的关注点也从面向个体的“个性化”扩展到面向群组的“共识化”。群组成员偏好聚合大多采用预定义的固定策略,例如均值聚合、最小痛苦聚合、最大满意聚合等,这些策略很难捕捉到复杂而动态的群组决策过程,对于近期提出的神经网络模型,成员之间的相互影响及动态的决策过程很难形成输入并通过训练进行表征。而为群组做出推荐时,如何能捕捉到用户的行为序列模式和
学位
文字自诞生起就承载着传递信息的责任。随着互联网技术与移动技术的迅速发展,存储在计算机上的信息以指数级别爆炸增长。文本作为信息的载体也因此增长迅速。对于计算机而言,存储与利用自然场景中的信息是以红绿蓝为基础元素的图片。令计算机自动识别图片中的文本信息有着广泛的应用意义,如自动驾驶、票据识别、人机交互等。近几年来,效果最好的模型大都是基于视觉语义的模型,这类方法通常先使用一个特征提取器将二维的图片提取
学位
<正> 贵刊1991年第1期第52页刊登于克俊同志撰写的"头痛饮治疗多种头痛81例观察"一文,我读后用此方法(川芎40g,当归、白芷、防风各10g,蜈蚣1条。前4味水煎两次兑匀,蜈蚣研细末,分两次用煎剂冲眼,每日1剂,12日为1疗程)治疗血管神经性头痛10例,疗效满意,特向贵刊作以汇报。 10例患者中男3例,女7例,年龄15~35岁,头痛史最长5年,最短1周,多方就医,均诊断为血管神经性头痛。经本
期刊