基于语义的政务信息资源检索研究与应用

来源 :东华大学 | 被引量 : 1次 | 上传用户:smartq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的深入发展,政务信息资源扮演着越来越重要的角色,而政务公文作为政务信息的载体,正在快速地向电子化,无纸化的方向发展。如何更好利用政务公文信息资源成为了一个重要的问题。目前基于查询关键字匹配的检索技术被广泛应用于电子政务公文的检索领域,这种方式虽然实现简单,但是存在着精度低,关联度低的问题。语义网的迅速发展为解决上述问题提供了一个很好的途径,通过对政务公文主题词建立本体库,不仅可以精确地查找出用户想要的公文信息,并且可以按照语义相关度进行分类和排序,列出相关的公文信息。本文的主要工作在于通过分析本体架构与《公文主题词表》架构得出两者的相似点,设计了一种基于《公文主题词表》架构的本体库;根据本体的构建原则和方法,得出了构建政务公文主题词领域本体的方法;根据政务公文关于会议方面主题词之间的相互关系,设计了政务公文主题词领域本体库中关于会议方面的语义关系,为建立全面的政务公文主题词的语义关系打下了基础;根据政务公文的特点,提出了计算机自动抽取政务公文主题词的方法;通过分析本体概念之间的相关度,设计了语义相关度矩阵,通过该矩阵实现了查询结果的分类展示。本文以政务公文资源检索为背景,就提高检索的查全率和查准率进行了深入的研究,提出了构建政务公文主题词领域的本体库,通过语义的分析和推理,增强政务信息资源有效利用,提升政务信息资源服务水平。通过建立政务公文信息资源检索原型系统,本文对上述的理论进行了实验,实验结果表明上面的理论具有较强的可行性。
其他文献
遗传算法是一种基于概率导向的随机搜索算法,已被成功地应用到多种学习任务和最优化问题中。对于遗传算法,策略(包括算法流程、算子及其控制参数)的设计和选择至关重要,会对
随着语义Web技术的标准化,关联数据在各领域得到广泛推广和应用,使得关联数据的发布达到空前规模,这导致了关联数据的存储和传输难度增大。通过压缩技术减小关联数据体积的方
图像的超分辨率重建是指从相同场景的单幅或多幅低分辨率图像中重构出一幅包含更丰富细节的高分辨率图像的技术。这一技术突破了硬件成像系统的限制,经济且有效地提高了图像
当今的大数据应用往往具有一个共同的特点,同样的计算往往在不断变化的数据上重复执行,例如社交网络数据和网页数据。在这些应用中只是少量数据发生改变,如果重新计算则工作
近年来,随着互联网和分布式计算的发展,海量数据处理的性能有了很大提升。在许多应用领域中,都需要从海量数据中提取出增量数据来满足某种业务需求,尤其是对于不断更新的源数
企业的信息资源具有分布式和异构性等特点,随着通用数据访问提供多源、异构数据源的统一访问方式,用户通过统一访问接口可以访问数据源中的数据,继而通过可视化建模工具对数
鉴于传统语音应用系统获取信息手段单一、信息量少、成本高等缺点,本文在分析SIP协议和VoiceXML技术的基础上,采用软交换技术设计并开发了基于SIP协议的语音浏览器,实现电话
百度指数发布的《中国网民科普需求搜索行为报告》表示人们最关注“健康与医疗”科普主题,但是目前大部分有关医疗的语义搜索、查询理解和自动问答都需要依赖于其背景知识图
随着互联网应用的不断发展,传统的基于文本的音频搜索引擎在用户体验上已经无法满足人们日益增长的使用需求。近年来,基于内容的音频检索(Content-Based Audio Retrieval,CBA
随着Internet及其相关技术的飞速发展,WWW已成为最大的信息集散地。无论对企业还是个人,Web逐渐成为最主要的信息来源。然而由于网站数量过多以及由此带来的信息泛滥,使得有