支持短句查询的信息检索方法研究及改进

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：robinleslie

【摘要】

：

随着计算机网络技术的飞速发展,Internet已经进入了人们生活的每一个部分,无论是工作、学习、还是休闲娱乐,网络上大量丰富的信息为人们带来了极大的方便。而面对海量信息,人

【作者】

：

余毅

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2008年期

【关键词】

：

信息检索短句查询词语加权句法分析排序算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机网络技术的飞速发展,Internet已经进入了人们生活的每一个部分,无论是工作、学习、还是休闲娱乐,网络上大量丰富的信息为人们带来了极大的方便。而面对海量信息,人们对文本检索的要求越来越高。作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,其中如何处理用户输入的短句,是智能检索的重要方向。　　在对现有的几种信息检索模型进行了分析研究,并详细描述了统计语言模型的算法思想,简单介绍了信息检索中目前常用的检索性能评测方法和评价准则。　　在对现有检索模型的分析基础上,基于统计语言模型思想给出了一种基于短句检索的自然语言检索模型。利用中文分词、词性标注、句法分析和词语加权等自然语言技术对用户输入的短句中所蕴含的搜索意图进行了深入的挖掘。并在对词性和句子结构进行理论分析的基础上,给出了一种基于词性和句法结构信息的关键词加权分析方法;在返回结果排序方面,结合多种信息给出了一种新颖的面向短句查询的排序算法。　　通过对现有句法分析方法的分析研究,针对三种无关性假设,在传统的chart线图算法基础上,给出一种引入祖先节点信息和位置信息的句法分析算法,并对比中国科学院计算所开发的Prop系统进行实验比较。　　最后,将设计的基于短句查询的信息检索模型应用于系统中,开发出原型系统,并解决系统实现中涉及的若干问题,并对实验结果和实际运行结果进行了分析,进一步以实验验证了利用此模型用户进行短句搜索的有效性。

其他文献

某大型企业制氧站故障诊断系统的设计与实现

本文针对某大型企业制氧站故障诊断的特点,建立了基于神经网络的故障诊断专家系统(ANNES)的模型及系统各组成部分(知识存储系统、学习系统、推理机、解释器和人机交互界面)的

学位

神经网络专家系统故障诊断知识库

基于复杂背景噪声的汽车车型识别研究

在科技高速发展的今天,计算机技术、电子、信息、通信以及自动化被普遍应用到各个领域,其中也包括道路交通管理。为了解决道路交通管理、路桥收费站自动收费等问题,世界各国

学位

等高线车型轮廓线定位模板匹配车型识别

Successful biliary drainage using a metal stent through the gastric stoma

We report a case of biliary drainage for malignant stricture using a metal stent with an ultrathin endoscope through the gastric stoma. A 78-year-old female was

期刊

stomastentdrainagecytologyesophagealendoscopeviewingretrograderestoredd

基于Schema的XML索引研究与实现

随着可扩展标记语言XML应用的普及,对XML文档查询的要求也就越来越高。如果不在XML文档上建立索引结构,那么针对XML数据的任何查询都很可能导致对整个文档树的遍历,对于海量

学位

计算机网络可扩展标记语言索引系统路径查询存储模式

基于OXMapping的SAML引擎的研究与实现

随着Web Service的不断发展,企业间业务的交叉也越来越多。企业和用户都面临着身份信息管理的难题。本文描述了针对这一需求的技术预研项目,根据企业应用的特点,对SAML2.0的

学位

单点登录SAMLXMLOXMapping

基于文件流行度的无结构P2P搜索机制研究

近年来以Gnutella和KaZaA为代表的无结构P2P文件共享系统已经成为当前Internet中最重要的应用之一。现有P2P文件共享系统采用的洪泛搜索机制会产生大量的冗余查询消息；同时由

学位

对等网P2P无结构文件流行度搜索机制预算机制文件共享

上海有个农民画村

农民画村很有特色,出名于上海金山的枫泾古镇中洪村。我驱车去过两次。第一次是今年的春天,油菜花儿开着,天空时而飘着小雨,地面湿漉漉的,进村后最触目的是农家墙壁上的农民

期刊

农民画上海金山文革时期六畜兴旺油菜金山农民画四十枫泾绘画风格枫径

基于RBAC的PMI系统的设计与研究

在信息技术飞速发展的今天,无论是企业还是个人都在享受着信息技术带来的便利,但是在信息技术带来便利的同时,随之而来的安全问题也日益突出,信息和网络的安全将变得越来越重

学位

访问控制权限管理基础设施基于角色的访问控制公钥证书属性证书

CSCW中并发控制的研究与应用

随着计算机技术、网络技术和分布式技术的发展,计算机用户正从单用户工作模式向多用户协同工作方向发展。计算机支持的协同工作(Computer Supported Cooperative Work,CSCW)

学位

CSCW协同设计并发控制、自适应并发控制机制

基于WEB的智能搜索引擎的研究与设计

近年来，互联网的规模不断扩大，网上的信息变得异常庞大复杂。搜索引擎的出现可以帮助用户在网络上方便的查找到自己需要的信息。随着网络的普及，网络在人们工作生活中的地位越来

学位

WEB智能化个性化知识库网络爬虫搜索引擎

支持短句查询的信息检索方法研究及改进

其他学术论文