论文部分内容阅读
随着互联网的发展,社交媒体在人们生活中的应用越来越多样化。而推特(Twitter)作为社交媒体中的佼佼者,已经成为近年来最流行的社交媒体应用之一。而社交媒体在政治事件中的影响也在与日俱增。2012美国总统奥巴马连任、英国脱欧公投等一系列政治事件的背景中都出现了推特的身影。推特在事件传播、反映民众的政治倾向上有逐步取代传统民意调查的趋势。目前在社交媒体上的政治倾向研究主要针对文本中的特定信息来进行分析,例如推文中的标签(hashtag)、提到(@)等。由于社交媒体数据不具有正式性,所以政治倾向分析的结果不够精确。同时对于社交媒体中的大选选情预测并没有特别完善的流程和方案。所以,本文通过图挖掘的方法,对社交媒体中的政治类事件进行分析研究。针对2016美国总统大选选情预测的问题,提出并设计了大选选情预测模型。本文的主要工作和创新点概括如下:(1)在推特数据上进行政治倾向情感分析和大选相关事件检测。在情感分析上,针对推特信息简短、非正式、缺乏补充信息的特点,本文采用了基于字典的情感分析方法,对推文的政治倾向性进行判断。同时对于情感分析中的反语鉴别难点,通过推文的表情符以及用户的历史推文来提升情感分析的结果。在事件检测中,针对美国总统大选的背景,本文采用了多次聚类、同义词拓展,关键词权重提升等方法,来对碎片事件进行整合。该方法提升了大选相关事件检测的性能。(2)利用图挖掘的方法来对推特数据进行研究分析。由于推特数据源上有多种多样的信息,例如用户,推文,图片,视频等等。而用户的点赞,转发和评论行为,往往也会表露出用户的政治倾向。所以,本文采用复杂网络分析方法,将不同类型的社交媒体数据投影到复杂网络中,再根据实际需求,对社交媒体复杂网络进行分析。在大选预测结果中发现支持总统候选人的用户社团。这种分析方法不仅仅适用于大选选情预测,还可以应用于社交媒体的舆论导向分析、用户影响力等方面。本文使用了真实社交媒体数据,分别对情感分析方法,事件检测模型和大选预测模型进行实验。实验结果显示,本文提出的大选预测模型可以对大选选情进行正确预测。