论文部分内容阅读
意见挖掘是当前自然语言处理的研究热点,它基于数据挖掘和文本挖掘技术,同时又具备一定的文本理解和倾向性分析的能力,可以帮助人们快速地从大量的评论信息中获取评论的总体情感倾向。本文将意见挖掘应用于中小学教师教育技术能力培训的评价中,设计了一个面向培训评论的意见挖掘平台。评价对象抽取和情感倾向性分析是意见挖掘的基础和重点。本文使用培训评论作为研究语料,着重对这两个核心任务进行深入的研究,研究内容如下:(1)提出了一种基于模式匹配的方法来对评价对象进行抽取。首先,建立语料库,然后通过构建种子规则,抽取有效评价句。再利用词性搭配组合以及词性距离相关性算法来抽取评价对象。(2)提出了一种能够识别评价对象关联对的方法,在句法树模式中将评价对象作为中心,从而实现对评价对象关联对的抽取。首先,采用句法分析工具Stanford Parser生成句法树,构建句法树模式库,并对句法树节点进行泛化组合,以提高评价词与情感词典的匹配率,然后使用相似度算法进行模式匹配。(3)在情感倾向性分析方面,构建了一个适用于网络评论情感分析的情感词典,并采用词典法进行极性分析。同时,考虑到评价词是经过泛化组合处理后的词语,且规模越来越大,现有的情感词典已经无法全部涵盖,因此,本文提出将拆分判别和语义相似度算法引入到情感词典匹配的方法中。(4)在上述研究的基础上,设计并实现了一个意见挖掘平台,同时构建实验环境,对所设计的平台进行测试。实验结果表明,本文提出的意见挖掘方法能够有效地减少情感倾向性误判的情况,提高精确率和召回率。