论文部分内容阅读
随着Web2.0的兴起和电子商务的飞速发展,通过网络在线购买商品已经成为人们日常生活的一部分。许多消费者习惯在购买商品之后,在电商网站上发表评论信息,表达自己对所购买商品的使用体验和看法。从这些产品评论数据中挖掘出用户对商品的评价信息,一方面可以引导其他潜在消费者选择合适的商品;另一方面商家可以通过这些用户反馈及时改进商品以满足市场需求。然而,对于网络上的海量用户评论,通过人工整理的方式从中获取信息并不现实。因此,使用情感分析技术挖掘用户评论中的有用信息已经成为了近些年来的热门研究课题。传统的情感分析方法难以针对产品属性进行细粒度的情感分析,只能给出产品评论的整体情感倾向。因此,本文在前人研究的基础上,通过对基于属性的情感分析方法进行详细研究,设计并实现了一个针对产品评论的情感分析系统。该系统能够实现对产品属性的情感分析任务。本文首先介绍了情感分析领域的相关技术,然后对情感分析系统做了具体的需求分析。接着介绍了系统的总体架构和详细设计及实现细节。最后通过系统测试,验证了系统功能。具体来说,本文的主要研究成果包括如下两个方面:(1)对现有的情感分析方法进行研究,针对中文产品评论,提出了基于属性的情感分析方法。本文通过基于关联规则的属性提取算法来挖掘产品属性,并利用基于LDA主题模型的情感分类算法对评论的情感倾向进行判别。(2)将基于属性的情感分析方法应用于实际,设计并实现了一个产品评论情感分析系统。使用该系统能够对产品评论进行属性级和评论级两种不同粒度的情感分析。此外,该系统还提供了产品对比和属性搜索等附加功能,使之更加贴近实际应用。通过系统测试,验证了系统的可用性。本文提出的基于属性的情感分析方法在属性挖掘和情感分类上都表现出不错的效果。以此为基础实现的情感分析系统能够较好的对评论文本进行细粒度的情感分析,具有较强的实用性和广阔的应用前景。