复句关系词自动标识系统中规则库及其维护方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:lwyhunter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文信息处理包括字处理、词处理、句处理和篇章处理三大内容,复句作为汉语语法的重要实体单位,其处理过程为中文信息处理的重要内容。“词处理”中汉语自动分词已有很大进展,而“句处理”中的复句信息化成果还很少,目前对复句的研究以提取关系词为基础,研究复句中关系词的自动识别对中文翻译和文本挖掘有很大意义。本文的研究即着眼于复句中关系词自动标识的基础部分—规则。在复句中关系词自动标识的研究中,基于统计与基于规则两种方法的结合是目前主流的方法,而两者中后者是前者的研究基础,本文即以基于规则的专家系统理论为基础探索关系词的自动标识。针对汉语语言的复杂性,本文首先分析汉语复句语料库,从中探索大量复句语料中规则的表示方法,即研究如何将语言现象归纳整理成以文字形式描述的规则。在描述规则时讨论规则的特征表示方法,包括其数据结构表示并根据不同的特征进行相关分类。由于文字规则机器无法识别,本文通过制定统一的形式化标准,将文字规则形式化为规则引擎可以识别的逻辑规则;其次,根据规则的特征规律建立规则库,即设计不同的规则表存储类型不同的规则,讨论规则库的逻辑结构设计和规则的物理存储,从而实现“静态存储,动态使用”,使得规则引擎能通过调用规则库中的规则达到关系词自动识别的目的;最后,由于规则库在使用过程中,随着规则的添加、修改、删除等更新规则库的操作,规则库的一致性很难得以保证,且随着规则的增多和内容的日趋复杂,人工维护出现很多弊端,因此本文建立一个基于抽象推理树模型的规则库维护系统并代码实现来检测规则的一致性和完整性,以此保证规则库的准确率和实用性。本文通过对规则库维护工具的用法测试,根据其检测结果并加以人工确认。实验结果表明,抽象推理树模型在规则库的检测中是可行有效的。
其他文献
借助于嫦娥一号星载CCD相机和激光高度计等设备,我们获得了描述月表形貌特征的海量月表地形数据。为此本文主要研究构建多尺度月表地形三维模型的若干关键技术,包括全月球海量
  当今是因特网飞速发展的时代,人们更多的依赖网络去处理平时生活中的各种事情,这样就给网络服务器带来了巨大的压力。传统的、单一的服务器模式受其CPU、内存和磁盘I/O等硬
基因扩增技术即聚合酶链反应(polymerase chain reaction)简称PCR,又称无细胞分子克隆系统或特异性DNA序列体外引物定向酶促扩增法,可将极微量的靶DNA特异地扩增上百万倍,从而大大
深度学习已经在人工智能领域中取得了显著的成就。这得益于其捕捉高维复杂特征的强大能力,而且并不需要人工特征的干预。利用深度神经网络来解决代码分析问题要比基于统计的
复杂三维装箱配载是将具有一定体积、数量、重量、价值的不同种类货物合理地放置在一个具有一定体积和载重量限制的集装箱空间内的过程。装箱主要是服务于港口以及产品物流行
随着互联网技术的不断发展,网络中的信息呈爆炸式的增长趋势,造成用户无法快速准确地找出满足自身需求的信息,这就是著名的“信息过载问题”。信息推荐技术,也称个性化推荐系
  虚拟现实技术极具研究与应用价值,近年来倍受关注。虚拟商城作为虚拟现实技术在电子商务领域的一个典型应用,为电子商务带来了无限生机。课题在研究虚拟商城漫游关键技术
  图论是近年来发展迅速而又应用广泛的一门学科。它最早起源于一些数学游戏的难题研究,以及在民间广泛流传的一些游戏难题。 以后随着科学的发展,图论在解决工程科学、运
  车牌识别技术是智能交通系统的核心技术,而车牌字符识别技术又是车牌识别技术中的核心,它在智能交通系统中起到举足轻重的作用。考虑到以往车牌字符识别方法借助于辅助硬件
微机电系统(MEMS,Micro-Electro-Mechanism System)、片上系统(SOC,System on Chip)和无线通信技术的进步孕育了无线传感器网络(WSN,Wireless Sensor Network)。这种网络系统