【摘 要】
:
随着电子设备的普及和互联网的迅速发展,社交媒体、网上购物、外卖点餐等平台的数据产生跳跃式的增长,如何对这些庞大的文本数据进行科学有效的分类管理成为目前研究热点之一。神经网络能在欧式空间结构数据中提取重要的特征用于分类,但是现实生活中有很多文本数据不具备整齐规则的空间结构,传统的深度学习模型在处理这些非结构化数据效果不佳,所以图卷积神经网络应运而生。经研究发现图卷积神经网络不仅适用于非欧几里得数据,
论文部分内容阅读
随着电子设备的普及和互联网的迅速发展,社交媒体、网上购物、外卖点餐等平台的数据产生跳跃式的增长,如何对这些庞大的文本数据进行科学有效的分类管理成为目前研究热点之一。神经网络能在欧式空间结构数据中提取重要的特征用于分类,但是现实生活中有很多文本数据不具备整齐规则的空间结构,传统的深度学习模型在处理这些非结构化数据效果不佳,所以图卷积神经网络应运而生。经研究发现图卷积神经网络不仅适用于非欧几里得数据,在传统的结构化文本数据中也表现良好。本文利用评论文本的情感极性为文本进行分类,引入表征学习能力较强的图卷积神经网络提升中文文本分类算法性能。但图卷积网络还存在一些不足:现有的图卷积网络只是单纯聚合相邻节点的信息得到数据的结构信息,忽略了文本中非常有用词节点表示和上下文相关性;使用了one-hot编码导致了语序结构的丢失,特征维度变高占据空间。以往的图卷积网络提取结构化特征时忽略了不同节点的影响将所有边设为同一个值,然而节点间关系一般并不相同,邻域内不同邻居节点对该节点的影响也不同;浅层图卷积无法使它们从高阶邻居提取信息,因此性能受到限制,但当图卷积网络层数过深的时候,会使节点信息过平滑,造成深层退化现象。针对上述存在的问题,本文根据中文评论文本的特点为了提升文本分类模型的性能,开展以下两个方面的工作:1.引入表征学习能力较强的图卷积网络应用于中文文本分类。针对图卷积网络忽略文本上下文信息的问题,本文提出了一种基于融合上下文信息图卷积的文本分类模型。同时对现有的文本数据转化成图数据算法进行改进,利用共现信息得到点互信息为图卷积网络构建邻接矩阵,将文本数据转化成图数据。原有的图卷积网络不注重词向量含有的信息,本章分别使用多种编码器训练数据集得到训练样本的初始特征表示,通过Bi LSTM层得到更深层次的文本上下文信息,同时结合图卷积的输出聚合成含有上下文信息的特征向量矩阵,此时的特征矩阵不仅含有全局上下文相关性,又包含局部结构化信息。2.针对现有图卷积网络忽略了不同节点的重要性将所有节点一视同仁的问题,本文通过中心节点的邻居节点数为其加权对邻接矩阵进行改进,使邻接矩阵不再是单一的0-1布尔矩阵。同时本文将残差学习的思想应用于图卷积网络,提出基于残差网络的图卷积单元应对网络层数过深时出现过拟合甚至梯度消失的情况,提高图卷积网络在深层条件下的分类性能。此外,还通过空间注意力筛选出对模型无效的信息。最后在四个二分类的公开数据集进行实验,本文的模型优于现有的基线模型,证明了本文改进图卷积网络模型的有效性。
其他文献
目的:我师王圣治师从刘明教授,本人得机会跟随刘师出诊。本文通过数据挖掘方法对刘明教授治疗慢性肾衰竭的用药处方进行了收集归纳、统计分析,以了解她独特的中医思想以及其他名老中医药的诊疗思路与方法,为今后的临床治疗积累经验,提供参考。材料与方法:通过收集刘明教授2021.06-2021.12的门诊病历63例,按照纳排标准整理出治疗处方192个,运用Excel将患者信息及用药处方录入表格,建立数据库。应用
目的 探讨针灸联合阶段性康复训练对脑出血后偏瘫患者运动功能及自理能力的影响。方法 选择156例脑出血后偏瘫患者,根据随机数表法分为对照组与观察组,各78例。对照组予阶段性康复训练,观察组予针灸联合阶段性康复训练,比较2组临床疗效、炎性因子、运动功能及自理能力。结果 治疗后,观察组总有效率(94.87%,74/78)高于对照组(84.62%,66/78)(P <0.05);观察组白细胞介素-2(IL
<正>国家能源准能集团设备维修中心成立于2003年2月18日,由准能设备维修中心和哈尔乌素设备维修中心组成,实行"统一领导、分权负责、集中管理、分别核算"的管理模式,共有职工1655人,下设9个职能部室、15个检修车间、84个班组,是准能集团的主要生产单位之一。主要负责黑岱沟、哈尔乌素两露天矿338台生产设备和205台自有辅助设备的点检、保养、维修工作。
目的:本研究运用Python计算机语言,深度挖掘、分析及总结《普济方》中治疗消渴及其相关病症的用药规律,为临床治疗提供更科学的文献学依据。材料与方法:人工检索辽宁中医药大学图书馆馆藏《普济方》中所记载的治疗消渴及其相关病症的处方。应用Microsoft Excel 2019构建处方数据库,使用Python语言统计出治疗消渴的高频药物、功效分类、性味归经等,并采取Apriori算法进行关联规则分析,
目的:本实验通过研究PMOP模型大鼠骨髓线粒体氧化应激相关蛋白,以及左、右归丸对PGC-1α信号通路的影响,从骨髓线粒体氧化应激的角度探讨肾之“阴阳互济”法调控PMOP骨代谢稳态的机制,为左、右归丸防治PMOP提供新的理论依据。材料与方法:SPF级2月龄SD雌性未生育大鼠90只,随机分为假手术组(SHAM组)、模型组(OVX组)、左归丸组(ZGW组)、右归丸组(YGW组)、补佳乐组(BJL组),每
目的:运用Meta分析系统评价雷公藤多苷治疗自身免疫性甲状腺炎的有效性及安全性,并利用网络药理学探索雷公藤多苷治疗自身免疫性甲状腺炎的潜在作用机制,为雷公藤多苷的临床应用提供有效的循证医学证据。材料与方法:第一部分为雷公藤多苷治疗自身免疫性甲状腺炎的Meta分析。计算机检索中国四大中文数据库以及Pub Med、Clinical trial、Cochrane library、Embase英文数据库数
目的:基于数据挖掘方法研究总结导师治疗感染后咳嗽的用药规律,运用网络药理学探讨核心处方治疗感染后咳嗽的作用机制,为感染后咳嗽的中医治疗提供依据。材料与方法:收集导师于2020年5月1日-2021年12月30日在辽宁中医药大学附属医院诊治的感染后咳嗽患者的相关资料,按照纳排标准共纳入382个病历,提取相关数据建立数据库;运用Excel、SPSS Modeler 18.0、SPSS Statistic
目的:对针刺联合穴位贴敷治疗心脾两虚型失眠和单纯针刺治疗进行观察、对比,分析二者疗效的差异性,验证针刺联合穴位贴敷疗法是临床治疗心脾两虚型失眠的有确切疗效及优势的方法。材料与方法:收集于2020.9-2021.12在我院神经内科门诊就诊患者资料,明确中西医诊断标准,严格遵守纳入、排除标准,筛选出70例诊断为心脾两虚型的失眠患者,随机分为治疗组和对照组,每组各35例,治疗组采用针刺结合穴位贴敷疗法;
目的:本研究旨在通过对2型糖尿病合并腔隙性脑梗死患者的一般情况、相关理化指标、中医证型等病历资料进行回顾性分析,以全面地探讨该病的相关因素、中医证型分布情况及其与各因素之间的关系。资料与方法:收集整理2020年10月至2021年10月期间在辽宁中医药大学康复中心内分泌科和辽宁中医药大学附属医院内分泌科住院的2型糖尿病患者的病历资料。依据是否合并腔隙性脑梗死分为2型糖尿病组(A组)和2型糖尿病合并腔
目的:1.研究藁本内酯对骨肉瘤增殖、迁移,周期和凋亡的影响。2.研究藁本内酯联合顺铂促进骨肉瘤细胞凋亡作用强于单独使用顺铂。3.藁本内酯发挥上述作用是通过ULK1/ATG3信号通路实现的。方法:第一部分实验,分为对照组和藁本内酯组。第二部分实验分为对照组、顺铂组、藁本内酯联合顺铂组。通过细胞毒性实验检测藁本内酯对骨肉瘤细胞增殖的影响。通过细胞划痕实验检测藁本内酯对骨肉瘤细胞迁移能力的影响。通过流式