基于概念网络的信息检索研究与开发实践

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:zhuobin0904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的扩张,如何提高信息检索系统对自然语言的处理能力,成为研究热点.传统的基于关键词字面匹配的方式无法解决复杂的语言关联问题,一些新的自然语言表达模型试图刻画语义关系,利用自然语言处理技术实现对文本信息的理解和检索.该文在分析已有模型和方法的基础上,提出了基于概念网络的信息检索思想,旨在采用自然语言处理技术解决检索系统文本分析的词法和语义问题,以语言单位的意义(概念)为核心,构建英语概念网络的语言知识表达方式,用于词法分析、关联搜索、语义匹配与相似度计算等方面.论文的主要内容分为三部分:1.研究并阐释了概念网络的表达体系,将概念网络用于英语的自然语言知识的表达.概念(义项)成为描述语言关联现象的基本单位,按属性、关系和行为三部分深入分析了概念的组成,不同的概念通过关系和行为(产生式规则)联系起来成为概念网络;分析了基于概念网络进行信息检索的可行性,对在此基础上的自然语言处理过程作了策略分析,认为需要分阶段和层次—词法、语法、语义和语用;初步构建了包含英语概念网络在内的实验用知识库.2.基于知识的多语言词法分析器.该文利用专家系统的技术,将词法分析的知识组织成数据、知识库和控制三部分,建立了一套规则表示与解释的机制;需要时推理机从数据库调用知识,实现了具体分析规则的内容与程序的分离,使得可以无需修改程序代码而直接向数据库添加、删除、更新知识,这给系统更新带来了方便;对于多语言词法分析来讲,就可能达到在同一个框架内使用内容不同的词法分析知识的目的.这个框架有望能够以很小的代价发展成德语、法语等同一语系的词法分析器.3.基于概念网络的词汇相似度计算模型.深入分析了模型的结构组成,研究了模型的不同部分词性、背景、词形和词义相似度的具体实现及其核心的概念网络搜索算法,模型设计体现了权值动态调整策略、关系的不同处理方式.
其他文献
IP多媒体子系统(IMS)是在UMTS系统的第5个版本中被引入,叠加在分组交换网络上,位于3G核心网中,利用基于软交换技术的全IP网络,负责3G系统中的多媒体通讯,支持传统的电话业务
依靠笔迹进行身份鉴别长期以来都是人们研究的焦点.迄今为止,针对于离线笔迹鉴别的研究已经比较广泛,但是在对在线笔迹鉴别的研究中,仍有许多关键性总是有待解决,尤其是针对
本课题就医学图像处理领域中的医疗图像三维重建问题做了较为系统的分析探讨,并对其中几个热点问题进行了深入的研究.传统的医学图像滤波方法,在滤除图像噪声的同时,往往会使
本文根据图像信号的特征对小波变换图像压缩进行了研究。文章围绕变换、量化和熵编码对小波编码方法进行了研究和改进,并把改进的算法应用到计算机图像通信系统中。变换部分:本
集成电路和计算机技术的迅猛发展使电子测量仪器逐渐向数字化、智能化方向发展,虚拟仪器是这类仪器中的代表.虚拟仪器有别于传统仪器,有着传统仪器无法代替的优势.虚拟仪器可
学位
本论文通过对两轮驱动机器人小车的运动模型的分析,提出一种非完整性两轮机器人小车运动控制器的设计方法。在将运动参量角速度和线速度进行解耦的基础上,引入速度控制器,通过反
投资决策是企业经营者面临的主要问题之一,其核心是比较一项投资所隐含的价值与投资费用,并判断其可行性。传统投资决策方法以净现值法为代表,通过比较预期收入流和费用流的现值
通过井下压力计测得地层压力变化以描述油藏特性是重要的试井技术之一。随着油田开发进入中后期,井下分层压力资料的获取具有重要意义。本文在原产品化的单探头压力计基础上,研
文中给出了用单片机实现的动态仿真装置,该装置既可以充当模型已知的工艺对象,也可以通过在线修改模型参数来仿真不同的对象.它具有可仿真多种对象、方便地改变对象参数和结