论文部分内容阅读
伴随着人类文明的发展与社会的进步,人类的物质精神文明得到极大发展和进步,同时,各种突发的自然或者公共事件也频频发生,给社会带来了极大的损失,如何有效及时的采取措施应对突发事件的发生是当前政府工作的重点。从突发事件的历史案例中进行学习和分析,可以辅助决策者获取历史经验,做出正常决策。由于突发事件历史案例多以文本形式存在,如何从文本案例库中查找与当期灾害相似的历史灾害案例以辅助决策者决策是亟待解决的一个问题,因此需要对突发事件文本的相似度计算进行研究。文本相似度计算已经有了较为成熟的发展,国内外很多学者都对文本相似度计算进行了研究。如,国外Gerard Slaton和McGill提出了VSM,即向量空间模型,将文本表示为若干词组成的向量,词条以特征项的权重表示,从而将文本转化为一个n维向量空间,然后计算向量间的相似度来衡量文本的相似度;Hirschberg提出了基于LCS的文本相似度计算方法。国内,晋耀红提出了基于语境框架的文本相似度计算方法,将文本抽象为领域、情景和背景三个层次来进行相似度计算;金博等提出基于语义理解的文本相似度计算方法。国内外学者对文本的相似度有较深入研究,但多是针对普通文本,基于文本的词语序列、关键词频率或者文本的语义结构的进行相似度计算的。与普通文本相比,突发事件文本侧重衡量的不是文本的语法语义主题的相似程度,而是事件的状态属性、起因、经过、影响、应急决策等要素的相似程度。本文结合突发事件特点,提出基于情景框架和依存模式的突发事件相似度计算方法,该方法的主要思想是:用情景框架的相似度来衡量文本的相似度。本文将突发事件情景框架模型ESF分解为“事件知识元、承灾体知识元、应急活动知识元、衍生灾害ESF”四元组,然后利用基于依存模式抽取事件信息,填充ESF情景框架,最后通过框架相似度来衡量突发事件文本的相似度,并通过实验,与VSM方法和LCS方法进行了对比,证明了该方法的有效性。