检务公开领域知识图谱设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liujm1006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检务公开作为司法领域机关为民服务的重要举措之一,是提高检察机关监督体系、规范司法行为、促进司法管理的重要组成部分。2018年最高人民检察院印发《全国检察机关智慧检务行动指南(2018-2020年)》,将“智慧检务”列入司法领域智能化发展战略,在推进检务智能化的基础上,提高司法领域信息公开和司法领域规范的强度。本论文利用检务公开领域的核心起诉书,通过大数据、人工智能及自然语言处理技术,设计以起诉书为基础的检务公开领域知识图谱,挖掘孤立、离散的起诉书信息,并提取案件中有价值的信息,将检察院、被告、检察员等提供的重要信息进行关联;在处理海量的起诉书文本过程中,利用知识图谱提高查找的效率和精确度,为知识推送(类案推送、文书推送、法条推送等)和智能问答等应用提供底层数据和技术支持。本论文中针对检务公开领域知识图谱的设计,涵盖本体设计、知识抽取、知识存储、图谱可视化等知识图谱构建方面的研究。具体而言,本论文的主要工作和创新点概括如下:(1)检务公开领域本体设计。以检务公开中的起诉书为核心,首先分析检务公开领域的需求与知识,进而划分该领域中实体概念、实体属性和实体之间的相互关系,构建起诉书信息模型。分析构建本体的方法和检务领域的专业术语与起诉书的特点,选择实用性高的“七步法”进行相应修改,提出适合本文中本体的建模方法,并应用改进的方法构建检务公开领域本体。(2)基于深度学习的知识抽取研究。由于检务公开领域的特殊性,起诉书的实体和属性标注的数据十分匮乏,通用知识抽取工具的抽取效果欠佳。本论文根据起诉书的特点,提取案件起诉书的关键词,并过滤无关信息,在此基础上提出基于BI-LSTM+CRF模型的命名实体识别模型。然而,检务公开涉及较强的专业性和较多术语,起诉书中存在大量的嵌套实体,且其具有特定的书写规范,导致了该模型在起诉书实体识别中不理想的应用效果。基于此,本论文提出了改进的BI-LSTM+CRF模型。实验表明,应用改进的模型能将P、R和F值分别提高4.14%、3.88%和4%,从而验证了改进模型的有效性。(3)检务公开领域知识图谱系统设计。通过分析系统需求,设计了检务公开知识图谱系统架构;结合图数据存储技术与检务公开领域本体特点,设计了知识图谱存储方法;通过构建原型系统,展示了检务公开领域知识图谱系统与用户的交互,实现了知识管理、知识查询和知识推送等功能。综上所述,本论文瞄准检务公开中的起诉书数据,主要解决了检务人员与群众如何迅速的从起诉书中获取需要的信息及相关联的信息。通过结合起诉书特点,研究起诉书的本体模型和实体识别方法,在传统的本体建模方法“七步法”上进行改进,并提出了融合起诉书特征的BI-LSTM+CRF识别模型,解决了现有的实体识别模型BI-LSTM+CRF对起诉书实体的识别不足与缺点;最终,实现对孤立非结构化数据的结构化存储,并通过知识图谱描述起诉书中各类实体的信息及之间的关系,提高了信息查询的准确率和高效性。
其他文献
近年来,随着语义技术的发展,越来越多的链接开放数据(Linked Open Data,LOD)被发布到互联网上。互联网正从原来的网页之间的“文档互联网”转向结构知识互联的“数据万维网”。然而,尽管目前公开的LOD数据集中有数以亿记的三元组和实体,但其中的层次化知识和模式层的公理却非常有限。为了填补轻量级的LOD数据和重量级本体表达之间的鸿沟,本文提出了链接开放模式(Linked Open Sche
表面等离激元(SPPs)是一种入射光与金属中自由电子相互耦合导致的一种表面电磁波,它被限制在沿着金属-介质的方向进行传播。它具有突破光学衍射极限的特性,基于SPPs的光学器件的尺寸能够被控制在亚波长范围之内,因此它在光通信器件小型化和高度集成化方面发挥越来越大的作用。本文主要针对基于表面等离激元的全光逻辑门展开研究,主要的研究内容和创新点如下。1.论文提出了一种基于光与轨道耦合作用的光开关和AND
学校教育的主要媒介是教科书。教科书不仅决定教育目的、教学内容、教学活动范围和顺序,而且是教育课程计划的基础。尽管教科书占据了如此大的比重,但还有很多学生更依赖于习题集或参考书。这种状况下,改善教科书质量的研究尤为重要,方法之一就是改善教科书的体系和内容。为此,教科书的体系和内容的分析是非常有意义的研究。初中阶段的数学几何主要是对二、三维空间的结构及性质的学习和研究。学生可以利用几何模型和空间推演来
行政公益诉讼案件的司法实践中,判定判定行政机关不履行监督管理职责时,行政机关是否负有监督管理职责应当是首要要件。确定行政机关具有监督管理职责能够使得检察机关准确的选择被告提起诉讼,从而能够更有效地实现挽回公益损失,保护公共利益的目标。同时只有在明确被诉行政机关具有怎样的监督管理职责的前提下,才能够进一步对其是否有履行的可能,以及履行所达到的效果进行判断,从而判定被诉行政机关是否履行了法定职责,其不
当前,四川脱贫攻坚进入决战关头,最后的贫困堡垒全部位于大凉山腹地。然而近年来这里大部分青壮年外出务工,留守家园的妇女就成为了大凉山的重要劳动力。针对这一现象,各级政
极化码在无记忆信道中被证明是容量可达的,因此该码字在近年备受关注,并已成为5G eMMB场景控制信道的编码方案。通过对洪水置信度传播(Flooding Belief Propagation,FO-BP)译
目的:筛选前列腺癌(PCa)与正常前列腺组织之间差异表达的长链非编码RNA(lncRNA),选取lnc-MX1-1为研究对象,探讨lnc-MX1-1对前列腺癌细胞增殖、侵袭和转移能力的影响,并进一步
服务组合是一种广泛使用的服务复用方式,它可以使用户无需知道复合服务的结构,只需关心其接口和功能,从而有效降低了系统开发的复杂性。现有的服务组合方法中,详细设计的服务组合方法总是会缺少对运行环境的考虑,而针对应用运行的服务组合方法又往往缺少对业务的考虑。此外,服务的需求一般来自业务分析人员,他们对需求的理解存在片面、主观的因素,开发人员所得到的需求很有可能与现实的需求不相符。根据以上情况,针对现有的
刑事诉讼法和司法解释对非典型非法方法获取口供的合法性体现出刻意模糊的态度,使实务中缺乏对其直接裁判的依据。这体现了对侦讯利益的偏倚而未真确地将非典型非法口供视为应斟酌和裁量的对象,造成司法实践中非典型非法口供排除难的现状,折射出将口供与真实可靠性相联系就能够被接受而淡漠人权保障的理解误区。因此,应加强对被讯问者意志自由自愿性的关注。通过再认识口供自愿性原则背后的价值,以及西方法治国家运用口供自愿性
苏轼不仅文章盖世,功业丰伟,其文化人格亦自足千古。他的治国理念、民本情怀、坚强意志和兼容儒、释、道的豁达人生,都体现了中华民族优秀传统文化的包容性和开放性,代表着中
会议