领域本体的半自动构建方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wtrgo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体(ontoloy)是一种用来描述概念以及概念和概念之间关系的模型,自提出以来就受到了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛应用。为了满足高效构建本体的需要,以信息提取技术为基础的本体自动提取研究也逐渐成为研究者关注的热点。 本文研究将统计自然语言处理和文本挖掘等相关技术应用到领域本体的构建过程中,进行领域本体的半自动构建。文中重点提出了两个算法。第一个算法通过利用浅层语言学规则以及统计信息一起来自动的得到合法的合成词。另外一个算法是利用提取到的领域概念上下文的统计信息,用于改进单纯基于广义后缀提取合成词分类关系方法的不足。 论文的结构组织如下:第一章引言;第二章介绍本体的相关概念和领域本体的构建过程:第三章讨论如何通过对领域文本的处理,提取领域中相关的概念;第四章讨论怎样从领域文本中提取概念之间的关系;第五章通过对特定领域文本进行实验,验证本文提出的各个算法的有效性;最后是总结与展望。
其他文献
运动目标跟踪是计算机视觉研究领域的重要课题之一,也是近年来备受研究者关注的前沿方向。运动目标跟踪的目的是通过从含有运动目标的图象序列中跟踪运动目标,并对其行为进行理
随着信息加速膨胀,人们发现越来越难找到自己需要的信息。搜索引擎的诞生,在一定程度上缓解了这个矛盾。但是,搜索引擎返回的结果太多,而且有时候结果并不是用户所需要的。问
在过去的几年中,无线传感器网络迅速发展,受到工业界和学术界的普遍关注。数据聚集作为无线传感器网络的关键技术之一,能够在很大程度上减少传感器节点的通信量,节约节点的电
随着以Web服务为基础的面向服务的体系结构的发展,如何有效的联合自治的、分布的、不同功能的Web服务构建新的企业业务应用成为新的热点问题。利用Web服务组合技术,企业业务
在统计机器翻译领域,基于短语的方法是最为成熟和稳定的方法,但是目前已经很难再有改进的余地。对于语料库中曾经出现过的短语,短语模型可以给出比较准确的翻译,这种翻译包括
为了能够更好地理解互联网内部的动态行为及其相关因素,建立有效的Internet链路延迟模型意义重大。Internet链路延迟建模对于分析和预测网络性能,从而更好地完成网络协议设计
中国是地质灾害的多发国家,尤其是滑坡灾害,一旦发生降雨,一些地方就很容易发生滑坡,对人们的生命造成危害,对财产造成损失。因此,如何高效的对区域滑坡灾害进行预防,是一个
人脸识别是模式识别、计算机视觉、人工智能等领域知识的一个重要应用,也是当前热门的研究课题之一。基于主成分分析(PCA Principle Component Analysis)的Eigenfaces算法是
DNA计算的海量存储和巨大并行运算能力,使其成为NP完全问题和其它难解问题的潜在解决方案之一,在理论上已成功的在多项式时间下解决了许多著名的NP完全问题。DNA计算的特点使
图像压缩编码研究和应用是目前信息技术中最为活跃的领域之一。图像压缩中研究最为广泛的是基于小波变换(DWT)的图像压缩方法。因为小波变换具有良好的能量集中特性,能从本质