产品评论信息的意见抽取研究与应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:aiminis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
产品评论信息的意见抽取是一类与文本的情感分类相关的研究,是当前智能信息处理、网络信息挖掘中的研究热点。情感词的自动发现与意见抽取是这类研究中的关键技术。 本文在前人工作的基础上对情感词的自动发现与意见抽取技术进行了研究,主要结果与贡献如下: (1)提出了基于双解词典的情感词自动发现方法SO-BL(Sentiment Orientation based on Bilingual Lexicon)。利用一个词典阵列与已知情感倾向的英文词表来预测中文词的情感倾向。实验证明SO-BL方法的准确率达到了93.29%。 (2)提出了基于HowNet的情感词自动发现方法SO-HN(Semiment Orientation based on HowNet)。其核心是用单个类别的种子集合抽取算法ESS(Extract Seed words for Single class of words)来扩展种子集合。ESS可通过一个种子词扩展出与该种子词情感倾向相关的种子集合,提高了情感词识别的范围。 (3)提出了基于共享模式的动词情感标注方法VSO-AS(Semantic Orientation of Verb based on the Model of Appearing Simultaneously),考虑了动词的特殊性,将其情感类标由原来的“正面/负面”调整到“对主语褒/对宾语褒/对主语贬/对宾语贬”。 (4)提出了一种新的意见抽取任务即意见实例抽取OIE(Opinion Instance Extraction)及其解决方法,即以特性实例为中心的意见抽取算法FC-OIE(Feature-centered Opinion Instance Extraction);提出基于位置线索的语义关系识别方法SAPPC(Semantic Association Recognition with Position Clue,),用于在FC-IOE中识别对象实例与特性实例之间的语义关联。 (5)本文将情感词自动发现和意见抽取技术应用于实际,提出并实现了产品评论信息的意见检索系统OSSCP(Opinion Search System for Comments of Products)。其目的是从网络评论中抽取产品评论信息的意见实例,帮助用户快速定位感兴趣的意见信息。
其他文献
随着网络的广泛普及和应用,网络环境下多样化的传播途径和复杂的应用环境给恶意软件的传播带来巨大便利,从而对网络系统及网络上主机的安全构成巨大威胁。这是恶意软件与杀毒
本课题针对视网膜图像处理中的关键技术问题作了研究,包括视网膜血管网络的提取、视网膜血管宽度的测量、视网膜图像的配准。通过对比研究常见的几种视网膜血管分割算法,采用KN
游戏引擎是最近十年出现的新名词,也是当前计算机应用技术领域倍受关注的一个研究方向。游戏引擎是同一类游戏中经过规范化的可复用部件,它有机结合了多种子引擎,包括图形、
网格是一门前景远大的研究领域。它是继传统互联网、Web之后的第三次大浪潮,被称为第三代互联网。与以往不同的是,它的目标是实现全球范围内互联网资源的共享和协同工作。网
我国铁路运输采用高度集中、统一指挥的管理模式,铁路运输调度在运输生产中起着核心和中枢作用。以前,铁路运输调度指挥系统基本采用手工作业方式,手段落后,制约了运输生产和铁路
通信技术、计算机技术以及网络技术的融合,产生了一个新的研究领域——计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)。CSCW的目标是利用计算机和通信技
本文提出并实现了一种全新的基于判别式模型和依存句法结构的树到树的统计机器翻译技术及框架,且性能堪比目前最好的基于句法的机器翻译模型。这种框架可以更灵活的利用目标
计算机三维动画是虚拟现实技术中十分重要的研究领域,采用计算机模拟真实的三维空间,构造三维的几何模型并赋予其表面颜色和纹理,设计模型的运动和变形,设计灯光的颜色、强度、位
随着云计算的发展和服务需求的增多,出现了面向业务流程的云服务系统,即云环境下的基于组件服务的软件系统。系统中云服务以业务流形式提供服务,而业务流中的每个任务均被绑
随着RMI应用的普及,其安全问题也变得日益凸现。虽然Sun公司也在不断增强其安全功能,但至今RMI技术仍缺乏访问控制方面的保护。目前访问控制功能的缺失,已成为阻碍RMI技术在I