基于注意力机制和图神经网络的节点分类研究

来源 :广东财经大学 | 被引量 : 0次 | 上传用户:firexuan1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图结构数据广泛存在于现实世界中,节点分类是基于图结构数据的基本任务。由于各节点的度大小不一,且节点间的相对位置无序,所以常规的分类算法在节点分类任务上不适用或表现不理想。图神经网络(Graph Neural Networks,GNN)因为同时利用到节点信息和边信息,在节点分类任务上的表现突出,成为当前学术界的研究热点。其核心构建思想是,节点依靠图结构交互彼此信息以实现节点特征表示,通过特征表示学习实现节点分类。所以,不同的节点交互方式使得图神经网络的构建方式多种多样,进而影响节点分类的效果。多样化的构建方式缺乏系统性和可解释性,不利于GNN的应用推广。针对目前的通用GNN框架难以综合分析和解释GNN构建方式背后原理的不足,以及在图注意力网络GAT及其变式GATv2中存在的静态注意力问题,本文的研究工作和创新如下:(1)提出图注意力消息传递框架GAMP。归纳现有的GNN构建方法,在通用GNN框架下引入注意力计算组件,形成新的图注意力消息传递分析框架GAMP,基于GAMP剖析GNN滤波算子中注意力计算方法与模型泛化能力间的关系,研究发现,GNN在应对基于“开放世界”的归纳学习节点分类任务中,应使用自学习的注意力计算方式以提高模型的泛化能力。(2)提出基于语义分解的注意力计算方法SD。为了解决在GAT和GATv2中存在的静态注意力的问题,SD从注意力的本质出发,将节点的单一特征表示分解为主体语义和客体语义。中心节点的主体语义和邻居节点的客体语义用于参与注意力计算,而邻居节点的主体语义用于参与消息表示。采用SD方法的GNN不仅可以解决静态的注意力问题,模型的泛化能力和表达力也有所提升。(3)设计图语义分解注意力网络节点分类算法SD-GAT。为验证SD对基于GNN节点分类任务的有效性,将SD直接应用在两种最常见的注意力机制之中,分别称SD-GAT-dot和SD-GAT-cat。在直推学习中,SD-GAT-dot在Cora和Citeseer上的准确率超过所有相关基准模型,其中在Cora上比最高的Graph SAGE-GCN高0.8%(达到84.1%),在Citeseer上比最高的GAT高1.3%(达到73.8%)。在归纳学习中,SD-GAT-dot和SD-GAT-cat在PPI上的micro-F1值分别达到0.991和0.992(GAT和VQ-GNN(GAT)的表现分别是0.973和0.9737)。
其他文献
少儿图书的出版是我国出版业重要组成部分,对整个图书产业的发展具有突出贡献。随着互联网技术的繁荣发展以及新冠疫情的防疫需求,人们的生活习惯不断发生改变,网络消费日益普及。直播营销凭借着真实直观、传播效果好、互动性强、变现快的优势,为出版社少儿图书营销开辟了新的方向。直播营销具有强大的社交属性,这是其生命力所在。根据笔者的亲身体验与网络调研结果显示,出版社少儿图书的营销现状可谓“喜忧参半”。一方面,少
学位
经济高质量发展已经成为全社会关注的重要主题。云南要按照党中央关于高质量发展的总体部署,主动服务和积极融入国家重大发展战略,以高质量跨越式发展赶超发达地区,与全国同频实现基本现代化。作为云南省经济发展的重要引擎,财政支持必将在提升云南省经济发展质量的进程中发挥更大的作用。在此背景下,云南省地方政府需要结合新发展理念,科学、合理地评价政府财政资源配置情况,不断完善财政支出规模及结构。本文测算云南省经济
学位
<正>糖尿病在临床上属于比较常见的一种慢性疾病,其主要特征表现为高血糖,典型症状为多饮,多食,多尿,消瘦[1]。社区卫生服务是整个城市卫生服务中的不可忽视的重要组成,在《健康中国2030》的规划中,明确提出需要对健康服务体系进行调整并不断优化,加强对基层的重视。基于健康社区这一重要环节,开展多途径健康教育,提升患者健康生活质量,进一步稳定与控制血糖水平,对糖尿病疾病控制具有积极作用。本研究,对社区
期刊
女性时尚杂志的出现意味着女性对时尚理想生活的追求和自我意识的觉醒,封面是杂志引领潮流的重要窗口。在女性话语转向的今天,读者和杂志出版商对杂志封面的凝视逐渐从“女性”移向“男性”。女性时尚杂志封面所建构的男性形象离不开女性意识的觉醒、女性的性别想象以及消费文化和社会资本的推动。那么,今天的女性时尚杂志究竟呈现了什么样的男性形象?杂志所展示的男性形象背后又存在怎样的传播偏向或神话意涵?带着这些问题,笔
学位
<正>彭博新能源财经发布的2021年《新能源展望》(NewEnergyOutlook)报告指出,为了在2050年前实现净零排放目标,全球需要173万亿美元的能源转型投资。2030年前,必须实现以下里程碑:每年新增505GW风电(为2020年新增风电装机容量的5.2倍)、每年新增455GW光伏(为2020年新增光伏装机容量的3.2倍)、每年新增245GWh储能电池(为2020年新增风电装机容量的26
期刊
为了解决电缆输入阻抗谱法对高阻故障定位距离较短、遮蔽区域大等不足,该文提出一种基于频域反射法的调频连续波(frequency modulated continuous wave,FMCW)电缆故障定位及类型识别方法。首先,依据FMCW电缆故障定位的原理结合电缆分布参数模型进行电缆故障定位仿真,获取电缆的FMCW幅值谱、相位谱。仿真结果表明,幅值谱可用于故障定位,相位谱可用于故障类型识别。根据仿真结
期刊
复杂跨越条件下互通式立交匝道曲线梁桥结构分析与优化是针对小半径曲线匝道梁桥的初步设计方案,本文运用Midas系列软件建立有限元分析模型,开展不同作用组合、工况条件和曲率半径匝道曲线梁的内力、位移、应力响应量的分析、模拟、计算和对比,获得各响应量的分布规律,确定最不利特征值;针对影响力学性能的主要因素提出相应的结构设计技术措施,以改善其结构性能,减小曲线梁“弯扭耦合”效应产生的不利影响,有效降低结构
期刊
目的 探讨以全程健康教育模式用于糖尿病患者的有效性。方法 以我院收治的74例糖尿病患者为研究对象,研究时间范围2019年7月-2020年6月,按照随机抽签法将患者分为两组,组别为参照组与研究组。参照组37例患者实施常规护理,研究组37例患者实施全程健康教育,比较分析两组干预前后血糖水平、疾病知识知晓评分、治疗依从性及干预满意度。结果 健康教育前,两组病人的血糖水平及HbA1c含量经统计分析差
期刊
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:如何从大量信息中找到自己感兴趣的信息或如何让自己生产的信息脱颖而出,受到广大用户的关注,均非常困难。推荐系统应运而生,而传统的推荐算法通常存在数据稀疏以及冷启动问题。知识图谱中存在大量的实体信息与这些实体间隐含的关联关系,并具有很好的扩展性;图神经网络作为一种提取
学位
当前,随着国际分工的不断发展,出现了以产品内分工为基础的全球生产网络、全球价值链。东亚生产网络是世界三大生产网络之一,早期形成的东亚生产网络是以日本作为领头雁的雁型模式。随着中国对外开放水平的不断提升,中国东盟自由贸易区的建立,中国参与东亚生产网络的程度不断提高。2020年,东盟十国以及中国、日本、韩国、澳大利亚、新西兰15个国家,正式签署区域全面经济伙伴关系协定(RCEP),这将进一步促进东亚生
学位