基于框架语义的中文本体学习研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:qxy489354518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,本体(Ontology)的研究在计算机领域日趋流行,在知识工程、数据库设计和集成、信息检索和抽取、软件需求分析、语义Web、面向对象的分析技术和基于Agent的系统设计中扮演着越来越重要的角色。虽然目前本体工程工具已经较为成熟,但本体的手工构建仍是一项繁琐而辛苦的任务,并最终很可能导致所谓的知识获取瓶颈,因此能否减低本体构建成本,实现本体的半自动自动构建逐渐成为本体研究的一个关键问题。本体学习是利用机器学习和统计等技术半自动或自动地从已有的数据资源中获取期望的本体,主要任务是从数据源中提取术语、概念及其关系。目前国外在该方向的研究很活跃,比较有代表性的是Maedche和Staab提出的平衡协作建模方法,包括本体的导入、抽取、裁剪、精练和评估。国内对本体自动获取的研究相对较少,李守丽等人借鉴了国外的经验,对利用奇异值分解和概念类聚进行汉语本体获取进行了初步讨论。由于中文语法的复杂性,基于中文的本体学习涉及自然语言处理,目前大多数方法都是基于句法分析和统计方法,句子的语义信息不能被充分理解,从语料库中获得的主要是句法信息。本文针对传统本体学习方法缺乏语义信息的不足,将Fillmore的框架语义理论引入到本体学习中。框架语义学的根本特点是经验主义方法,中心思想是词的意义的描述必须跟语义框架相联系。框架作为一个语言学术语,是指人们理解语言时激活的大脑已有的认知结构,这种认知结构是通过词语反映的。本文的第三章、第四章详细介绍了框架语义理论。在第四章中介绍了汉语框架语义知识库的构建、基于框架语义的句法分析、语义标注,比较了框架语义标注与传统的标注方法在描述句子语义上的优势。本章最后我们在标注的结果中,抽取出了我们需要的部分语义特征,构造句法-语义映射结构,该结构为以后本体学习中的一个关键要素。本文第五章分析了现有本体学习系统的体系结构,在句法-语义映射结构的基础上对中文本体学习中的概念抽取、关系学习、模式发现进行了研究,提出了相应的学习方法,对现有的本体学习方法作了语义扩充。
其他文献
科学计算可视化是实现三维地震数据三维解释的主要方法,它运用计算机图形学和图像处理技术将三维地震数据转换为图形及图像在屏幕上显示出来并进行交互式处理,主要包括面绘制
虚拟经济发展迅猛,在整个经济体中占据相当大的比例,已经成为人们日常生活中的重要组成部分,尤其是以网络游戏、app应用、云服务等为代表的虚拟交易十分火热,创造了大规模的
语音识别是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。作为人工智能领域一个重要的研究课题,它的发展将会对未来的人机交互界面带来极大的影响
随着传感器技术、计算机网络及无线通信技术的发展,无线传感器网络(Wireless Sensor Network,WSN)在相关领域得到了广泛的应用。但同时网络中感知的数据量不断增加,采集数据
三维地震数据场的可视化对石油勘探起着重要的作用,它把采集到的物理数据转换成图形、图像,并通过给体数据赋颜色和不透明度,以及改变观察角度等方式来展现三维地震数据场的
随着计算机网络技术的迅猛发展,信息安全的重要性与日俱增。数字签名能为数据传输提供身份认证、数据完整性认证和不可否认性等安全服务,因此成为近年来的研究热点。目前研究
云平台为用户提供了执行任务的计算和存储资源,供应商根据用户使用资源的情况计费以获取利润。随着大规模数据需求的迅速增长,存储资源变得越来越重要。然而,对用户和供应商
随着计算机技术的快速发展,网络应用已经在全球得以推广,人类已经进入了网络时代。网络已经成为了人们日常生活中不可缺少的一部分,并在国民经济中发挥着日益重要的作用。然而,由
目前,WebServices技术正受到产业界和学术界越来越多的关注,其应用也越来越广泛,出现了不少功能相同或相似的Web服务。为了对它们加以区分,人们通常采用服务质量(QoS)作为评价和
传统的实体解析是指,给定一个或多个描述现实世界的引用集合,识别其中对应于现实世界中同一实体的所有引用的过程。实体解析是数据清理,数据集成,数据挖掘等技术中关键的一步