论文部分内容阅读
冲突预测一直是国际政治领域一个备受关注的主题,但传统的冲突事件数据较为稀缺,细粒度(1)的观测数据也难以大规模收集,因此预测在准确性和及时性方面都存在较为明显的不足。基于海量大数据的事件数据库的出现,使国际冲突研究的数据量和质量大幅提升。与此同时,日益强大的数据分析技术,为大规模观察和分析政治暴力活动并探索冲突动态带来了可能,也为冲突预测带来了可能。本文的总体目标是利用庞大和细粒度的全球事件话语数据库(GDELT),通过实际冲突案例进行细致的实证分析,并基于GDELT提供的事件大数据建立相应模型,利用长短期记忆循环神经网络算法对冲突的动态进行预测预警。与此同时,鉴于可公开访问的互联网社交网站(社交媒体)在信息传播中起着关键作用,本文选取了两个案例,通过相应的数据抓取和分析,验证了民众通过社交媒体反映出的态度对政治事件走势的影响,即有效监测民众对于政治事件的态度情绪变化有助于揭示影响社会和政治不稳定的舆论趋势。因此,本文提出,对于国际冲突的预测,可以在利用GDELT事件大数据建立模型进行第一重判断的基础上,对可能引发冲突的事件,利用社交媒体大数据分析民众对该事件的情感极性,作为判断冲突是否发生的第二重标准,以此提升冲突预测预警的准确性。论文共分为七个部分。第一部分为绪论,首先介绍研究的选题背景、选题目的、研究问题、研究意义和数据来源;接下来对与本研究有关的概念进行界定和辨析,包括大数据、大数据分析、计算国际关系学等;然后对国内外研究的现状、路径和问题进行文献回顾;最后对论文的创新点、难点、研究方法和基本结构做出概述。第一章着重理论阐述,涉及政治冲突理论和本研究的数据基础。界定了与政治冲突有关的概念,探讨了冲突与和平研究理论的发展历程以及冲突预测研究的现状与不足。由此引出本研究的数据基础——基于GDELT事件数据库的事件大数据,并解释选择该数据源的原因。第二章选择“阿拉伯之春”、2018—2019年苏丹冲突以及法国“黄马甲”事件作为案例。在对事件数据进行分类(分为口头合作、实质合作、口头冲突、实质冲突四类)的基础上,根据GDELT数据库提供的数据对上述案例进行分析。结果显示,口头冲突及实质冲突事件数量占事件总数比例的显著增加能够作为冲突爆发或紧张局势加剧的征兆。第三章从社交媒体大数据入手,在社交媒体日益影响公民参与和政治进程的情况下,通过对社交媒体数据的挖掘和分析,监测民众对政治事件的态度及情绪变化。本章选取了英国脱欧与弹劾特朗普两个案例,证实了社交媒体数据能够反映民众对政治事件的影响,进而有助于预测包括政治冲突在内的政治事件走向。这充分说明,社交媒体数据可以对来源于主流新闻媒体的事件大数据预测研究进行有益补充。第四章进行冲突预测模型的构建,详细阐述了模型的基本假设、使用的算法和技术以及具体的构建过程。然后对已经构建的冲突预测模型进行测试和验证。结果显示,基于LSTM RNN算法的冲突模型能够较为有效地预测相关冲突的发生并对可能出现的局势恶化进行预警。第五章是探讨了冲突预测领域的大数据应用的风险,以及基于大数据的冲突预测存在的问题和挑战。结论部分对本研究进行概括总结,并提出了未来进一步研究的方向。