【摘 要】
:
互联网对人类社会的影响既快速又深入,现如今人们在互联网中的活动不仅是对互联网信息的单纯上传与下载,而是更多地与互联网中的其他个体进行信息与情感的交流,这让我们有机
论文部分内容阅读
互联网对人类社会的影响既快速又深入,现如今人们在互联网中的活动不仅是对互联网信息的单纯上传与下载,而是更多地与互联网中的其他个体进行信息与情感的交流,这让我们有机会在互联网中观察到更加丰富的用户情感表达。如何对互联网中的用户情感表达进行分析,深入挖掘其中的潜在信息既是产业发展的重要需求,也是科学研究的关键问题。情感分析一直是自然语言处理领域的重要课题。目前主流的情感分析方法,往往是单纯地利用文本特征进行情感计算,却忽视了情感的主体,即用户本身对其情感表达的影响,从而限制了情感分析的最终效果。本文针对上述问题,主要进行了两方面的工作。第一,构建包含用户和词语的异质网络,并采用网络节点嵌入的方式对用户表示和词语表示进行联合学习,获得带有一定情感极性倾向性的用户表示和词语表示。通过这一学习过程,用户和词语能够被清晰地分割开,不同极性的用户和词语也得到了明显的区分。第二,结合异质网络节点嵌入的联合表示学习结果与卷积神经网络,即将基于异质网络节点嵌入学习到的用户表示和词语表示作为卷积神经网络的输入,构建情感分析模型。在IMDB,Yelp2013和Yelp2014三个数据集的实验结果显示,本文提出的方法相较于目前的最优系统准确率分别提升了2.6%,1.8%和1.4%。本文提出了一种在异质网络节点嵌入的过程中引入用户信息,同时对词语表示和用户表示进行学习的方法,提高了模型描述能力,从而有效提升文本情感分析的性能。这一基于异质网络节点嵌入的表示学习思路可以拓展到其他的表示学习领域,通过不同的连接策略达成引入更多信息的目的,具有很好的可扩展性。此外,本文应用认知语言学理论指导深度学习算法设计,具有一定的创新性。
其他文献
近年来随着新需求、新技术不断涌现,传统的单一网络提供的业务已不再满足用户对业务的需求,跨网融合业务的出现已成为趋势。在实现融合业务过程中,会话控制系统是重要保障。
本体能够解决特定应用中的知识共享问题,因而在实际应用中,不同用户和团体常常根据不同的应用需求与应用领域构建或选择合适的本体,使本体所描述的内容在语义上往往重叠或关
众所周知,K-means聚类是数据挖掘中非常经典和常用的方法之一,它通过计算数据项之间的距离可以把相似的数据项聚集在一起。随着信息化、数字化、网络化进程加速,经济全球化已
随着信息技术的快速发展,越来越多的生物医学研究成果在互联网上发布,如科学文献和专利等文本数据的规模正在以指数级的速度快速增长。这些数据以非结构化形式存储,其中包含
随着计算机技术不断的进步,信息技术已经深入到国防、教育、经济等各个社会领域。信息技术核心之一的是数据库技术,它在信息系统中承担着存储和管理信息的使命。目前,在不同的应
在高等教育大众化的今天,在校大学生的数量日益激增,教师的数量、工作量也在不断攀升,怎样用信息化的手段和计算机技术来科学地评价教学、统计分析教学工作量,保证教学质量,是高校
从工业化经济为主转向以服务型经济为主是我国产业结构调整的方向,因此加快发展现代服务业具有重要的战略意义。共性服务集成与运营支撑系统是“十一五”科技部支撑计划重大
Web Services安全技术研究是一个具有重要理论价值和现实意义的研究课题。基于XML的Web Services对于提升业务的适应性和项目的集成具有重要作用。现有的安全措施还不能很好
生物特征识别认证技术可分为单模式(unimodal)生物特征识别认证和多模式(multimodal)生物特征识别认证技术。目前的每种单模式生物识别认证技术在准确率、用户接受程度、成本
测力机是重要的力值计量与检测设备,它是用某种方式将力值复现在力的传感器上,从而达到测定力传感器的目的。在各种各样的测力机中,静重式测力机是以重力作力值复现的来源,其结构相对简单,准确度高是其它力值计量手段所不及的优点,常作为国家力值检测标准(基准)设备,在计量、国防、生产等领域被广泛采用。在实际应用中,静重式力标准机用少量砝码交换组合产生各种力值。在依次递增的加载序列中,由于砝码交换出现力值临时下