论文部分内容阅读
随着近些年知识图谱技术研究的不断深入,各行各业都逐步引入这类数据处理的新型技术。知识图谱能为领域提供更有价值的决策支持,在公共安全方面,可以将追踪对象的各个特征拼接在一起,并通过图谱将各种零散的信息关联在一起,从而形成一个完整的信息网络,帮助工作人员快速定位问题,找到解决方案。所以,本文系统化的研究基于安全领域的知识图谱构建,并且对关系抽取方法进行了改进。本文详细分析了知识图谱构建流程和方法,并设计了一种新的关系抽取算法来提升实体关系抽取的正确性。知识图谱大多应用在某个垂直领域,但现有方法只关注抽取算法,忽略了领域特殊表达会能更加快速的提取句子对应的实体关系,而半监督学习方法只需要少量标注语料即可完成较准确的抽取结果。所以本文提出了使用领域表达特征和Boot Strapping算法融合的改进方法,通过从案件描述文本集中抽取出该领域内对应的特殊简单句式,并且根据句法分析可得出其对应的实体关系结构,若是测试数据集中某句子句式符合抽取出的领域句式结构,则使用提取出的句式来抽取实体关系,若不符合则将其处理后加入到待处理集合中,实体关系抽取方法使用的是Boot Strapping算法。为了验证本文方法的有效性,从网络获取实验文本后进行清洗处理,同时抽取部分语料人工标注验证算法结果,实验结果表明本文改进的算法较单纯的Boot Strapping算法的关系抽取结果有很好的提升。最后本文基于设计的知识图谱方法进行案件搜索平台的设计和实现,并展示实现结果。