基于降噪自动编码器的不平衡情感分类研究

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:LeoPark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,网络评论的情感分类研究大部分是不平衡样本数据,正向样本的数量一般远大于负向样本,对这种不平衡样本集进行分类时容易产生少数类误差较大的问题。而且由于网络评论的表达形式多变,不易获取到大量的有监督的数据。针对上述问题,对无监督的不平衡网络评论情感分类进行研究。首先通过改进降噪自动编码器,提高少数类的特征值,避免分类样本向多数类偏移。然后将获取的特征值作为k-means算法的输入值,实现了无监督的样本分类。实验证明,该算法对不平衡率较高的样本具有良好的适应性,从而验证了算法的有效性。
其他文献
通过对痹证病因病机的分析,认为其病机是:风、寒、湿、热、痰、瘀等邪气滞留肢体筋脉、骨节、肌肉,经脉闭阻,气血运行受阻,筋脉、肌肉、关节失于濡养,不通则痛或不荣则痛,故“
摘要:文章从软件工程的角度出发,以计算机网络通信原理为指导,结合当前网络流行的几种网络聊天软件所采用的常用技术,介绍了如何实现网络聊天软件客户端的过程。  关键词:网络聊天工具;VB;Winsock控件;客户/服务模式  中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)22-5492-04  Network Chatting Software (Client) Base
针对长庆油田某区块低渗透裂缝性油藏裂缝发育、非均质性严重的特点,通过实验研究了注入时机对氮气驱油效率的影响,优选氮气驱注入方式并对气液比和段塞大小进行了优化。实验结
多孔介质的本身及原油流动特征的复杂性决定了研究含蜡原油在多孔介质中的蜡沉积规律方法的困难性。与地面管流状态下蜡沉积规律的实验方法不同,本文从满足油藏应用的需求出
简要介绍了XPath技术,分析了使用XPath路径表示式选择XML文档节点的方式,分析了.NET对XML文档的访问支持,探讨了在.NET环境下,基于XPath技术使用C#语言实现XML文档数据提取的
啊!十里店,  我的梦中情人。  当年惊于你的美丽,  让我一个劲儿地走神。  大河,高山,道路,麦田,  一水儿的娇黄耀人眼。  绿树, 黑瓦,红日,蓝天,  老天爷也玩儿起了调色板。  羊皮筏,老水车,小毛驴大桶驮水,  好一派“异域”风光,野性的美。  校舍枕着田垄,鸟鸣和着读书声。  城乡在这里融溶,文明在这里诞生。  平川上来的小年轻咋能不动情?  这里一切的一切,都如此新鲜、生动。  
分子印迹技术是高聚合物质对特定目标分子进行选择性识别和分离的技术,可以对目标分子进行高灵敏的检测和分离,因而得到广泛应用。制备了一种基于氧化硅的表面分子印迹聚合物,提
通过改善,提高候机楼内的火警预防,运用电子巡视管理系统进行管理。从而降低了候机楼内的火灾发生,并提高了中控运行科工作人员的整体技术和管理水平。
目的:观察依达拉奉联合巴曲酶治疗急性脑梗死的临床疗效.方法:将80例发病在72小时以内的急性脑梗死患者随机分为治疗组40例和对照组40例.对照组给予巴曲酶10、5、5U依次加入生