基于半监督递归自编码的情感分类研究

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:vict1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析在数据挖掘领域有着十分重要的地位,文本情感分类又是文本情感分析中的一项重要研究内容。文本情感分类是指利用自然语言处理方式,对文本的主观情感倾向性进行分析,包括抽取文本中与情感倾向性判断有关的各个要素,判断文本的情感倾向性等。文本的情感倾向性可以分为正面、负面、中立等不同情况。针对互联网上的海量评论文本,如何对其进行快速有效的分析与利用引起了越来越多学者的重视。目前关于情感分类问题的研究,主要分为基于情感词典的情感分类和基于机器学习的情感分类两大类,且都取得了不错的成果。但由于基于情感词典的分类方法中情感词典的好坏将直接影响最终分类的准确率,而情感词典的构建又完全依赖于人的主观经验,因而很多学者着力于构建更好更完整的情感词典。在基于传统机器学习的方法中,建模的过程中通常使用较简单的函数,计算也往往使用诸如统计等一些简单的运算方法,所以通常被认为是浅层学习。本文引入基于深层学习的半监督递归自编码(RAE, Recursive Auto Encoders)方法来解决中文文本的情感分类问题,它通过学习非线性的深层网络结构,利用分布式向量来表达文本的特征,从而弥补了浅层学习在表达能力和泛化能力方面的约束。为了证明半监督RAE方法的有效性,文中首先建立传统的支持向量机(SVM, Support Vector Machine)情感分类模型进行文本情感分类,得到的最优情感分类结果是87%。然后利用基于深层学习的半监督RAE方法,得到的最优文本情感分类结果为88.3%,在文本预处理、特征选择等处理过程与基于传统SVM方法完全相同的情况下,准确率提高了1.3个百分点。
其他文献
随着我国社会生产力的不断提升,我国的教育事业也逐步踏入新的台阶.目前我国主要实行德智体全面发展的素质教育,切实践行素质教育对于提升我国义务教育的整体水平具有重要的
在科学技术快速发展、客户需求迅速变化以及经济全球化的社会背景下,产品生命周期日趋缩短,不断开发新产品已成为企业获取持续竞争优势的重要方式。然而,产品技术构成和制造
在时代的迅速发展当中,我国的小学数学教育模式进行了持续性的优化和拓展,已然加强了对学生主体性的关注,要求实时培育学生各方面的素质和修养,实现较高质量的教学.作为小学
基础教育是以提高整个民族素质的根本价值为基础和前提的,基础教育是以育人为首要目标的.小学语文教育更是重中之重,体现着提升学生对中国传统文化的学习的必要性.教学方法是
数学离不开解题,教师应立足课标,研究教学,把控好题目难度,甄选好题,让学生学习更加高效而非陷入题海.
在新基建引领下,安防视频监控正迎来新风口,但挑战也如影随形.近年来随着视频监控应用范围不断延伸,海量视频监控点将带来新的数据安全问题,从而对视频监控网络的数据安全防
期刊
词语的积累对小学语文学习是非常重要的.本文讨论了小学语文积累词语的有效途径,尤其是将课内和课外、课本与生活联系在一起的有效途径,希望可以为小学语文教学水平提升提供
小学三年级要面临的第一大问题就是如何写好作文.笔者认为需要在一、二年级打好阅读基础,增加阅读兴趣;三年级选择性的阅读名著;通过细心观察生活,积累课内外好词好句,鼓励孩
预防调度的目标通过对项目中各种不确定因素的估计和描述,在满足顺序关系和资源等各种约束条件下,生成具有一定抗干扰能力的调度方案,最大限度的降低与实际执行方案的偏离程度。本文主要研究了任务工期和发布时间两个参数的不确定性问题。其中,任务工期的不确定性描述项目信息的不完全性、执行过程中设备故障等引起的波动;发布时间是指任务的所有外部准备活动的结束时间,描述原材料供应和运输等外部环境的不确定性。对于工期不