基于深度学习的文本情感分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jianrui02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,社交平台和电商平台的数量急剧增加,世界各地的用户在互联网上发表意见、表达情感已经成为一种新的习惯。利用自然语言处理技术对互联网上的文本进行分析,并挖掘其中所包含的情感倾向已经成为社会舆情监督和厂家售后信息反馈的重要途径。因此,研究文本情感分析方法具有重要的社会意义和商业价值。现有的情感分析方法主要分为基于情感词典的情感分析方法和基于机器学习的情感分析方法。基于情感词典的文本情感分析方法很大程度上依赖于情感词典的质量和覆盖度,而基于机器学习的文本情感分析方法依赖于人工构建和抽取的特征。近年来,深度学习技术在自然语言处理领域取得了很大的进展,因此本文主要研究基于深度学习的文本情感分析方法。本文主要的工作包括:首先,针对循环神经网络无法学习长距离依赖信息的问题,本文将长短时记忆格替换循环神经网络的隐藏层节点组成长短时记忆型循环神经网络模型,并将该模型应用于文本情感分析任务。在NLPCC2014年基于深度学习技术的情感分析(NLPCC-SCDL)评测任务数据集上的实验结果表明,预训练词向量的加入能够有效地提升模型的分类性能和训练速度。相比于NLPCC-SCDL评测中的最佳系统,该模型在中文数据集的正面情感倾向性判别上的F1值提升了0.2%,在英文数据集的负面情感倾向性判别上的F1值提升了0.6%。然后,针对现有基于卷积神经网络的文本情感分析模型中全连接分类层对非线性分布的数据不能够有效地进行情感分类的问题,本文提出了一种结合卷积神经网络和支持向量机的文本情感分析模型。此模型首先将输入样本的词语序列替换为对应的预训练词向量序列,然后将卷积神经网络作为自动特征学习器去学习输入样本的特征表达,最后将获得的特征表达作为支持向量机的输入以得到最终的类别标签。在NLPCC-SCDL评测任务数据集上的实验显示,相比于NLPCC-SCDL评测中的最佳系统,该模型在中文数据集的正面和负面情感倾向性判别上的F1值分别提升了1.2%和1.0%,在英文数据集的正面和负面情感倾向判别上的F1值分别提升2.7%和2.9%。以上两部分的实验结果表明,深度学习技术能够有效地提升文本情感分析的性能,并且本文提出的对深度学习模型的改进方法进一步提升了文本情感分析的性能。
其他文献
江门市南洋船舶工程有限公司(JNS),位于广东省江门市,专业制造100,000载重吨以下散货船。公司下辖两个厂区,占地总面积720,000平方米,岸线1,000米,拥有现代化造船设施。  JNS先后与香港太平洋航运公司(Pacific Basin)、丹麦劳里森公司(Lauritzen Bulker s A/S)、丹麦诺顿公司(NORDEN A/S) 、南非IVS(ISLAND VIEW SHIPP
1液压油中水的来源及其危害对于颗粒物污染,现在基本上都比较重视,一般采取了相应的措施进行控制.而对水、空气、微生物等其他污染,目前还没有象对颗粒物污染那样给予足够的
目的探讨2型糖尿病患者临床排尿习惯的改变及超声表现。方法观察154名糖尿病患者排尿次数(次/d)、排尿时间(s)、每次尿量(ml)B超残余尿量(ml)及膀胱壁厚度(mm)。并观察随膀胱
对液压阀控马达速度伺服系统进行了研究.在系统建模分析的基础上,分别采用PI控制策略和最小方差自校正控制策略对系统进行了控制,并用Matlab对两种控制结果进行了仿真比较.研
我国高等教育体制变革在激发高校办学主动性的同时,促使高校管理模式从稳健管理模式时代转入风险管理模式时代。从高校财务风险预警基本理论出发,结合高校财务风险的特点,从
采用溶胶-凝胶法制备了钒-钛-磷系醋酸/甲醛合成丙烯酸的催化剂,通过XRD和电镜表征催化剂结构,并考察了催化剂的焙烧温度、钒钛比、活性评价温度及酸/醛比对催化剂的影响。研