论文部分内容阅读
在应急领域,处置知识是关于灾害情景及其应对任务的关系的知识。处置知识帮助应急工作者了解事态并预测事件发展趋势,还为决策者提供应对建议,是应急知识库中最重要的知识。自然语言文本中包含了大量突发事件相关的专业知识,灾害规律以及应急措施,并且分布广泛、信息量大,是提取知识的优质知识源。为此,本文研究如何从自然语言文本中提取应急领域的处置知识。就目前研究,从自然语言文本中获取知识还存在着很多问题。首先,在多数领域中,文本信息提取的主流方法仍然是手工提取,这样做效率低下,无法处理海量文本,因而最终获取知识的全面性不足。虽然基于文本的自动知识获取研究已经出现,其研究过程缺乏领域约束,导致冗余信息过多;内容上也以事实获取为主,对关系知识的获取研究并不多见。其次,在进行自动文本知识获取时,由于汉语自然语言理解上的困难,使得知识提取规则构造困难,致使知识获取效果欠佳。针对上述问题,本文研究如何从领域内海量的文本中自动提取处置知识。本文采用词典驱动和规则匹配相结合的方法,首先通过分析自然语言文本中的因果关系的特点和应急领域的处置知识需求,提出应急领域处置知识表示方法。然后以汉语自然语言文本为研究对象,设计处置知识的提取方法。具体的做法是:首先基于应急领域知识需求构建领域词典,包括域知识词典和任务知识词典;再基于对汉语因果句子特点的分析,提出从自然语言文本中提取因果句,并设计规则进行分解;然后从分解结果中获取领域知识和任务知识,合并形成处置知识;最后是对上述方法的实验验证。根据实验结果,本文提出的方法实现了从文本中快速提取应急领域处置知识的目标,且具有较高的准确率和召回率。因此,采用词典驱动的规则匹配方法对从应急领域文本提取应急领域因果知识具有较好的效果。从自然语言文本中提取处置知识,一方面将文本信息提取研究扩展到了应急领域,另一方面也为应急知识获取提供一种新的思路,有助于更快地构建领域知识库,促进应急工作的开展。