【摘 要】
:
伴随着互联网的发展以及新的网络应用的出现,互联网用户由单纯的“读”网页,向“读、写”网页,共同建设互联网发展,由此网上产生了大量带有用户主观感情的数据,从这些带有主
论文部分内容阅读
伴随着互联网的发展以及新的网络应用的出现,互联网用户由单纯的“读”网页,向“读、写”网页,共同建设互联网发展,由此网上产生了大量带有用户主观感情的数据,从这些带有主观感情的海量数据中挖掘出网络用户的观点在现实生活中具有很大的意义,在这种背景下文本情感分析(sentiment analysis)技术应运而生。
文本情感分析近年来成为一个新的研究热点。根据研究的粒度大小不同,文本情感分析可分为词汇级、句子级以及文档级,然而句子级以及文档级的情感分析往往以词汇级的为基础。目前对于词汇级的情感分析研究有基于规则的方法和基于机器学习方法,针对中文文本词汇级情感分析大部分使用基于规则的方法。基于规则的方法,通常具有较高的准确率,但召回率很差,为此本文对此进行了深入的研究。
首先,针对基于规则的情感词汇自动识别算法的不足,提出了基于条件随机场的情感词汇识别算法,该方法将情感词汇识别当成序列标注任务,并给出了标注集、特征模板以及特征验证与特征筛选的方法。实验结果验证了基于条件随机场的情感词汇自动识别算法的有效性。
其次,针对传统基于词汇相似度的词汇褒贬性自动识别算法的不足,本文提出了一种改进的基于词汇相似度的褒贬性自动识别算法。该算法以基于聚类的褒贬基准词选择算法为基础,基于词群的概念克服了词汇间相似性与词汇间褒贬倾向不一致对词汇褒贬性计算的影响。实验结果表明,该方法在准确性方面优于传统基于词汇相似度的词汇褒贬性计算算法。
最后,给出了一种评论文摘自动生成的方法,该方法基于评价搭配抽取,评价短语极性判断以及评价对象聚类。实验结果验证了该方法的可行性。
其他文献
基站是现代移动通讯的基础设备,基站管理水平直接决定移动通讯服务的质量和效率。基站维护管理信息系统是管理和维护通信基站的信息系统,对提高维护效率、降低维护成本具有重要
指纹识别是目前应用最为广泛的生物特征识别手段,通过它可以快速准确地鉴定一个人的身份信息。但是自动化的指纹识别需要大规模的指纹数据库作为算法训练库,而采集指纹数据涉及
随着互联网上信息量的爆炸式增长和空间信息科学的发展,在很多应用中都需要求给定对象的kNN和RkNN,如在文本分类、智能导航、现代通讯、交通控制、气象预报等各个领域都有着广
分类作为数据分析形式的一种,它可以从大量的数据中提取描述所有对象的模型。由于分类是利用已知的模型对新的数据进行预测,因此它是一个很好的有监督的学习过程。一个好的分类
软件系统在成为商业组织重要的IT支撑的同时,也难以避免地面临着结构的退化。随着业务需求带来的维护和变更,软件从底层代码到整体架构都出现了难以维护的问题,当其架构问题
智能交通监控技术一直伴随着计算机技术、电子技术和通信技术的发展而进步。随着交通部门对执法依据品质要求的提高,大众法律意识的增强,以及行业信息化、网络化发展趋势的确立
随着传感技术和微电机系统技术的发展,传感器网络获得了广泛的应用。在监控移动日标的应用中,移动传感器网络比静态传感器网络更有优势。在移动传感器网络巾,如何保证网络的
对于各职能部门使用的纸质或电子文档形式的预案,不便于统一管理、查阅,在预案使用时不能够达到快速、准确地查找到需要的预案及内容。在预案管理系统中需要解决的核心问题是预
近几年来,光电技术以及指纹采集仪器和方法都有巨大进步,高分辨率的指纹识别成为可能。高分辨率指纹特有的指纹第三层汗孔特征,不仅具有唯一性,而且其数量庞大,形状不一,还可防造假
随着信息技术在农业领域的广泛应用,农业信息技术已经成为引导农业生产、科研、教育、管理进一步发展的强大动力。借助先进的计算机工具完成农产品信息采集、发布工作可以极大