基于领域本体的政府信息检索系统的设计与实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:sdmaxdh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
政府信息检索系统作为政府信息公开平台的重要组成部分,对于用户从大量信息中.准确查找所需信息起到关键作用,然而现有政府信息检索系统存在两个主要问题:一是系统采用的基于关键词匹配的检索技术忽视了对于用户检索条件的语义的理解,缺乏对于文档实质内涵的准确描述;二是由于对政府信息领域知识的缺乏,用户不能很好地提出符合自己检索需求的检索条件。这两个问题导致检索结果远远不能满足用户的要求。   本体是“概念模型的明确的规范说明”,它提供明确定义的词汇表,描述概念和概念之间的关系,被当作某个领域内不同主体之间进行交流的一种语义基础。它被广泛的应用于信息检索,特别是基于知识的检索中,能显著提高检索系统的查全率和查准率。   本文提出了构建政府信息领域本体并将其应用于政府信息检索系统的方案。首先,研究了现有的领域本体构建方法;在分析了政府信息领域的特点,考察了该领域可用资源的基础上,提出了基于政务主题词表的政府信息领域本体的构建方法。该方法充分利用了《综合电子政务主题词表》中已有的主题词和关系,保证了本体概念添加的完备性和科学性,减少了对领域专家的依赖,提高了构建效率。   设计和实现了基于领域本体的政府信息检索系统。该系统以领域本体为核心,对检索条件进行了扩展,既解决了检索词同政府信息中的公文用词存在差异的问题,又进一步明确了用户的检索需求;对政府信息文档进行了语义标注,提高了检索匹配时的准确度。同时,系统将与检索条件相关的领域概念反馈给用户,便于用户了解领域知识,进一步优化检索条件,获得更全更准的检索结果。  
其他文献
以Web应用服务器为代表的分布式组件中间件系统(如EJB,CORBA,.NET)已发展为Web计算环境中的主要基础软件。中间件系统通过屏蔽底层平台的异构性,提供大量应用所需要的服务(如事
目前分布式体系结构的研究重点是提高系统的可扩展性、互操作性和可重用性,而对于实时性要求高的分布式仿真系统,还需要在HLA体系结构基础上,考虑如何提高系统的数据传输效率,以
无线传感网,直观的说,就是以现代科技的方法对没有生命的各类生活中的设备进行改造,并进行信息的传递和交互。自从被提出以来,无线传感网迅速引起全世界各个国家和地区的重视
本文以动态开放的对等协作应用环境为背景,围绕实现安全协作存在的公平性、真实性和策略实施一致性安全需求,针对其中的激励机制、声誉系统、索引系统和访问控制授权管理等关键
有穷模型论是受数据库理论和计算复杂性理论推动而发展起来的数理逻辑的一个研究领域。有穷模型论的主题之一就是研究逻辑在有穷结构上的表达能力,围绕这一主题本文取得如下结
本论文主要研究共代数中的互模拟证明方法及其应用两个方面。   代数理论已被证实在计算机科学中具有广泛的应用,其对偶概念——共代数理论是近年来兴起的一个理论,它在描述
随着计算机图形学、人机交互和虚拟现实技术的不断发展,虚拟人任务级行为分解规划方法在虚拟维修以及智能人机交互等方面的应用日益广泛,成为诸多研究领域关注的基本问题。近年
随着计算机芯片的速度不断提升,器件的门限电压越来越低,因此单粒子翻转的瞬时故障越来越容易发生。特别是在太空环境中的计算机系统,在宇宙射线的影响下,瞬时故障更为频繁,系统可
近些年来我国高校招生人数不断增多,同时国家对高校投入也不断加大,高校建起了越来越多的实验室。但实验室管理人员相对增长较少,需要一个有效的管理系统来帮助他们。而现有
图像是计算机感知世界、理解世界的重要方式。随着物理硬件和数码技术的不断发展,成像设备能够采集高时间分辨率、高空间分辨率、多光谱等等多维度的视觉信息,但同时受场景的限