面向社交媒体文本的中文隐式情感分析研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:DownLoad0005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国网络技术普及度的加深,网络社交媒体中产生了海量的带有情感色彩的文本数据。研究者们根据情感表达中是否含有情感词,将其分为显式情感表达和隐式情感表达,由于我国网民更倾向于通过含蓄的方式来表达情感,所以中文的隐式情感表达数量非常庞大。对这些海量的隐式情感表达进行分析,是情感分析研究中不可或缺的重要部分,在舆情分析、升用户体验以及改进服务和产品质量方面,具有广泛应用场景和重要研究意义。本文对源自社交媒体平台的文本数据进行充分分析后,归纳了中文隐式情感表达中存在的两大问题:(1)情感表达中不具有明显情感特征的“弱特征”问题;(2)情感表达中具有多种情感倾向性且均不具有明显情感特征的“多混淆弱特征”问题。本文对面向社交媒体文本的中文隐式情感分析方法开展研究,基于源自社交媒体的文本数据,主要的目的是解决中文隐式情感表达中的“弱特征”与“多混淆弱特征”问题,以实现对中文隐式情感表达更有效的分析。本文主要的研究工作如下:(1)出“基于层级知识增强的多池化模型”。该模型通过层级知识增强的方式,对文本中不同级别的知识信息进行充分的融合学习,以缓解隐式情感中的“弱特征”问题;同时使用多池化方法,对学习到的文本表示进行多个特征的取与分析,来对隐式情感中出现的“多混淆弱特征”问题进行建模。本文出的方法在中文隐式情感公共数据上的对比实验结果表明,F1得分则相对最优模型高出5.9%,达到了最好水平。由此表明本文出的模型可以有效缓解“弱特征”和“多混淆弱特征”问题,能够较为准确的对中文隐式情感进行分析,证明了本文出模型的有效性和优越性。(2)出了“基于融合义原知识表示的中文隐式情感分析方法”。目的是从不同于上一研究点的角度,通过借助外部义原知识库来缓解“弱特征”和“多混淆弱特征”问题。该模型在对文本进行表示学习过程中融入义原知识,能够有效的对文本语义进行细致的述与刻画,升对中文隐式情感表达中低频词的训练质量,同时可以在学习到词语语义关联性的基础上,进行更接近文本本质语义的建模工作,对文本的理解能力进行增强。实验效果表明,本文方法的F1得分相对于其他对比实验高出3.33%,可以对中文隐式情感进行较好分析,在一定程度上缓解其中的“弱特征”以及“多混淆弱特征”问题,证明了本文研究思想的有效性与可行性。(3)搭建“中文隐式情感分析原型系统”。该系统集成了本文出的中文隐式情感分析模型。首先,实现对输入中文文本的预处理。其次,通过模型计算出输入文本对应的三种情感倾向性概率,并得到最终的情感分析结果。最后,将该输入文本的分析结果以可视化形式展示给用户。
其他文献
近几年,随着人工智能技术的广泛应用,句法分析等深层自然语言分析的关注度越来越高。句法分析的主要任务是分析一个句子的构成,并使其可以转化成句法树。通过句法分析,可以解析一个句子的构成词块,词与词之间的关系,从而帮助机器理解自然语言,并运用于机器翻译、自动问答、文摘生成等语义理解领域中。句法分析是自然语言处理的一个经典任务,本文主要研究汉语层次句法分析中的边界问题。首先通过剖析短语结构的层次句法分析的
古代石刻文献在我国历史文化研究中向来都是一项不可或缺的研究内容,具有重要的史料价值,但由于自然环境的侵蚀或是人为破坏,石刻文献的表面出现了若干大小不一、分布不均、形状多变的干扰区域,这不仅影响了人们的观感需求,而且对历史研究造成阻碍。信息化时代的来临,可将重要的石刻文献进行数字化储存以延长文物保存时间,也可通过网络共享的方式对石刻文献进行二次传播,打破时间地点的限制,增加古代历史文化的受众面,使用
芒果表皮缺陷检测是实现芒果的智能化采摘、果实质量分级的重要前提。基于卷积神经网络的计算机视觉技术为缺陷检测提供了可行有效的方法,是目前最为主流的检测方式。在自然环境下,光照的强弱、背景的复杂、果实枝叶茎干的相互遮挡等制约因素下,给芒果表皮缺陷的检测带来了巨大的挑战。采用深度卷积神经网络,可以提取更多的特征,具有更加实时精准的识别效果。因此,本研究采用基于语义分割、实例分割的方法研究自然环境下芒果表
图像融合的目标是将来自同一场景的多幅源图像的互补信息进行融合,生成高质量合成图像。红外图像反映的是目标在红外热辐射下的能量分布,不易受风沙烟雾等复杂条件影响,但其可视性并不是很理想,特别是物体纹理细节信息表现较差。可见光图像主要与目标场景的光反射有关,物体辨识度高,但容易受到外部环境的影响,特别是被遮挡时就无法准确地捕捉目标特征信息。所以,红外与可见光图像融合能够综合两种成像的优势,通过结合二者的
钢水碳含量终点预测作为转炉炼钢重要的一环,准确的预测将直接关系到炼钢效率,有利于减少能源和原材料浪费。由于熔池内不同比例的钢水碳含量能够反映在炉口火焰颜色、纹理形态等信息的变化上,因此采用炉口火焰图像特征提取的终点碳含量预测方法为传统预测提供一种新的参考,但火焰作为一种复杂变化的非结构对象,具有较强的随机性和相似性,给特征提取带来不小的困难,进而影响到终点预测的准确性。针对上述问题,本文将从钢水碳
转炉炼钢生产过程中,终点碳温的准确预报是钢铁产业至关重要的一环,而碳含量的准确预报对于提高钢铁冶炼工艺具有重要的意义。本文针对转炉终点炉口火焰图像相似性高,传统特征方法难以提取区分碳含量相近的火焰图像的关键特征,从炉口火焰图像的颜色特征和纹理特征提取入手开展研究,为提高基于炉口火焰图像特征提取的转炉炼钢终点碳含量预测准确率打下基础。本文的主要研究内容如下:(1)采用基于卷积神经网络火焰特征提取的终
行人重识别是一种利用计算机技术判断摄像机收集的视频或图像中是否存在特定行人的技术,可以自动地对多个不交叉摄像机捕捉的行人图像进行匹配,因而在智能监控系统中发挥着显著作用。但现有的大多数行人重识别方法是在单个有标记数据集上进行训练和测试的,如果在源数据集上训练的模型直接应用到目标数据集上会产生因行人图像风格差异等因素引起的域偏移问题,从而导致最终的识别精度很低。现实场景中已标记的行人样本是极度缺乏的
在当今信息时代的背景和进程下,作为信息技术载体和媒介的印刷电路板(Printed Circuit Board,PCB),从我们日常生活中经常接触和使用的手机、电脑等各类电子产品,到军事中的飞机、卫星等领域都有着广泛的应用。由于工业生产中对PCB更高的要求加之现在的电子产品高度的集成化,PCB板的生产更加细化、走线结构更加复杂,从而导致PCB板带有缺陷的概率大大提升。PCB板必须保证线路连接、线距以
纤维结构是存在于太阳色球层中的一种呈现出喷射状态的线性拉长结构,研究色球纤维的动力学特征能够帮助人们对太阳大气质量平衡以及针状体的演变过程进行更进一步的研究。进行纤维结构动力学特征的研究的前提是对太阳色球纤维进行准确的识别和提取,因此选择一种高效准确的识别方法是当前人们的关注重点。在进行色球纤维识别前,我们首先对纤维图像的特点进行了分析研究,发现当前纤维识别的难点以及存在的问题仍然有许多。因为在色
预测和推理未来结果的能力是智能决策系统的关键组成部分。近些年,以深度学习为代表的机器学习预测算法取得迅猛发展,广泛应用于天气预报、自然灾害预警、疾病诊断等领域。然而,在太阳光球磁场演化研究方面,由于缺乏完备的数据集和全面的评价标准,以及演化过程中存在磁结构运动、形变、浮现、消失等多种复杂变化交织的问题,使得直接在时间和空间上预测磁场的演化过程具有较大挑战,所以目前尚无对太阳磁场的演化过程进行预测研