论文部分内容阅读
随着互联网时代的迅速发展,博客、微博等社交网站已经成为人们生活娱乐的一部分。人们已经习惯在这些平台上发布文章、生活信息、情感领悟等。因此,网络上迅速拥有了大量的富含情绪的文本。情绪分类研究的目的就是自动分析这些文本所表达的情绪,例如,开心、生气、悲伤等。近些年来,情绪分类得到了计算机语言学领域学者们的越来越多的关注,成为自然语言处理领域中的一项基础任务。情绪分类研究分为不同文本粒度的研究,即篇章级,句子级(短文本)以及词语级的研究。本文主要针对句子级情绪分类展开以下几方面的研究:首先,本文提出了一种基于整数线性规划的情感和情绪联合学习方法。该方法利用情感分类任务和情绪分类任务二者的标注数据来探索两种任务的联合分类。具体而言,我们根据情感倾向和个人情绪之间的联系,设计了一系列情感标签和情绪标签之间的限制,并且通过整数线性规划方法,得到优化后的情感和情绪分类结果。实验结果表明,该方法不管在句子级情感分类还是句子级情绪分类任务中,都获得了较好的分类效果。其次,本文提出了一种基于标签关系的句子级情绪分类方法。该方法通过研究句子级样本的情绪标签共现情况以及单样本情绪标签数量范围约束等现象,得到情绪标签间的关系,并且利用这类关系进行多标签的句子级情绪分类。具体而言,根据得到的标签关系,设置情绪标签之间的限制,并且通过整数线性规划方法,得到优化的多标签句子级情绪分类结果。实验结果表明,该方法能有效地使用标签间关系来帮助学习,从而获得更好的分类效果。最后,本文提出了一种基于上下文关系的句子级情绪分类方法。该方法的核心思想是在已有的文本特征基础上,加入上下文关系共同建模,从而进行多标签的句子级情绪分类。具体而言,针对每个实例(句子),构造对应于每个情绪标签的伪样本以及这些伪样本构成的样本网络用于描述样本间的上下文关系。在此基础上,构建关系因子图模型用于实现在文本特征基础上,加入上下文关系的情绪标签学习。实验表明,该方法能够有效利用样本上下文关系来帮助多标签的句子级情绪分类,并取得了更好的分类效果。