支持短句查询的信息检索方法研究及改进

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:robinleslie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的飞速发展,Internet已经进入了人们生活的每一个部分,无论是工作、学习、还是休闲娱乐,网络上大量丰富的信息为人们带来了极大的方便。而面对海量信息,人们对文本检索的要求越来越高。作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,其中如何处理用户输入的短句,是智能检索的重要方向。  在对现有的几种信息检索模型进行了分析研究,并详细描述了统计语言模型的算法思想,简单介绍了信息检索中目前常用的检索性能评测方法和评价准则。  在对现有检索模型的分析基础上,基于统计语言模型思想给出了一种基于短句检索的自然语言检索模型。利用中文分词、词性标注、句法分析和词语加权等自然语言技术对用户输入的短句中所蕴含的搜索意图进行了深入的挖掘。并在对词性和句子结构进行理论分析的基础上,给出了一种基于词性和句法结构信息的关键词加权分析方法;在返回结果排序方面,结合多种信息给出了一种新颖的面向短句查询的排序算法。  通过对现有句法分析方法的分析研究,针对三种无关性假设,在传统的chart线图算法基础上,给出一种引入祖先节点信息和位置信息的句法分析算法,并对比中国科学院计算所开发的Prop系统进行实验比较。  最后,将设计的基于短句查询的信息检索模型应用于系统中,开发出原型系统,并解决系统实现中涉及的若干问题,并对实验结果和实际运行结果进行了分析,进一步以实验验证了利用此模型用户进行短句搜索的有效性。
其他文献
本文针对某大型企业制氧站故障诊断的特点,建立了基于神经网络的故障诊断专家系统(ANNES)的模型及系统各组成部分(知识存储系统、学习系统、推理机、解释器和人机交互界面)的
在科技高速发展的今天,计算机技术、电子、信息、通信以及自动化被普遍应用到各个领域,其中也包括道路交通管理。为了解决道路交通管理、路桥收费站自动收费等问题,世界各国
随着可扩展标记语言XML应用的普及,对XML文档查询的要求也就越来越高。如果不在XML文档上建立索引结构,那么针对XML数据的任何查询都很可能导致对整个文档树的遍历,对于海量
随着Web Service的不断发展,企业间业务的交叉也越来越多。企业和用户都面临着身份信息管理的难题。本文描述了针对这一需求的技术预研项目,根据企业应用的特点,对SAML2.0的
近年来以Gnutella和KaZaA为代表的无结构P2P文件共享系统已经成为当前Internet中最重要的应用之一。现有P2P文件共享系统采用的洪泛搜索机制会产生大量的冗余查询消息;同时由
在信息技术飞速发展的今天,无论是企业还是个人都在享受着信息技术带来的便利,但是在信息技术带来便利的同时,随之而来的安全问题也日益突出,信息和网络的安全将变得越来越重
随着计算机技术、网络技术和分布式技术的发展,计算机用户正从单用户工作模式向多用户协同工作方向发展。计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)
近年来,互联网的规模不断扩大,网上的信息变得异常庞大复杂。搜索引擎的出现可以帮助用户在网络上方便的查找到自己需要的信息。随着网络的普及,网络在人们工作生活中的地位越来