【摘 要】
:
随着社会的发展,人们对数字信息的需求越来越强烈,信息技术面临着种种挑战,如信息的表示、知识的共享、软件的复用等等。如何对网络上的海量信息组织、管理、维护和复用并为
论文部分内容阅读
随着社会的发展,人们对数字信息的需求越来越强烈,信息技术面临着种种挑战,如信息的表示、知识的共享、软件的复用等等。如何对网络上的海量信息组织、管理、维护和复用并为企业用户等提供有效迅捷的服务已经成为科研领域一个广泛关注的问题。本体作为一种共享的概念化模型,已经越来越为人们所关注,并在人工智能、知识工程、语义检索等很多领域都得到广泛的应用。但手工构建本体是一件繁琐辛苦的任务,需要耗费大量的时间和资源,尤其构建领域本体还需要领域专家的参与,是本体发展的一大瓶颈。为解决该问题,人们开始尝试自动或者半自动构建本体,即本体学习。本体学习是利用统计、机器学习、自然语言处理等技术半自动或者自动地从已有的文本、HTML文档、数据库等数据源中获得期望本体的技术,目前的研究重点在于概念以及关系的提取。传统的本体学习方法多采用基于统计的方法,而本体中概念、关系之间更多侧重的是语义聚合性,由于忽略了语义因素对抽取结果的影响,对于概念和概念间关系的提取准确性欠缺。针对以上问题,本文提出了一种基于过滤机制的本体学习方法,采用词汇上下文构造概念向量空间模型,利用余弦法计算相似度来表示词汇之间的语义相关度。利用语义相关度对提取的概念、概念关系对进行过滤,以达到提高准确率的目的。另外,在概念关系学习的基础上,本文对分类关系的获取方法进行了探索:采用术语包含法获取分类关系,并设置了置信度度量公式,对获取的分类关系赋予可信度度量指标。为验证模型的有效性,本文完成了一个本体学习系统,将传统本体学习模型与基于语义过滤的本体学习进行对比实验。在对实验结果的评价中,本文引入Hownet词汇相似度计算软件,通过计算词汇之间的语义相似度来构建参照标准本体,增强了实验结果评价的客观性。实验结果表明,改进的模型能够有效的提高概念、关系的查准率,证实了基于语义过滤的本体学习模型的有效性。
其他文献
乘性噪声出现在很多图像应用领域,如医学超声图像、SAR(Synthetic Aperture Radar)图像,它与信号强度息息相关,因此乘性噪声的去除更具挑战性。然而传统乘性噪声去噪方法往往
Retinex图像增强方法是近年来研究较为热门的图像增强方法,该方法以人类视觉系统的色彩恒常性为理论基础,通过模拟人眼观察场景的方式,恢复因图像采集设备限制而丢失的场景细
编程题在线评判技术是协调庞大编程学习者群体和稀缺的教学资源矛盾的手段之一,它弱化了学生数量对教师工作量的影响,使大规模编程在线教育成为可能。当前流行的编程题在线评
杂草是影响我国农产品质量和产量的重要因素之一。目前除草主要靠喷洒除草剂,而且是大面积的均匀喷洒。.这种喷洒方法不仅提高了农业的成本,也破坏了土地的质量,污染了环境,
特征选择是数据挖掘领域中一个重要的研究课题,特征选择可以剔除学习过程中冗余的、无关的和有噪声的特征,从而得到一个维数最少而判别能力更强的信息特征子集。可以有助于提高
Web应用系统以其易于部署和良好的可维护性等特点,以及能够提供丰富的用户界面而变得越来越流行。随着国家和企事业单位信息化建设的高速发展和信息量的快速膨胀,传统模式的Web应用系统越来越显露出许多问题,例如,较低的响应速度和较差的服务性能。一种新的Web开发技术—Ajax正在成为Web应用领域的研究与应用热点。Ajax技术使用异步调用模式对Web页面进行局部刷新,以“按需取数据”的方式向服务器发送和
随着我国城市化进程和城市基础设施建设的加快,如何保障城市排水管网的运行安全是急需解决的问题。建立城市排水管网安全运行动态监测系统是必要的。在山地环境中,有线网络存
网格计算环境日益成为一种不受地域限制的廉价的超级计算环境,它试图聚合分布在世界各地的计算、存储、知识、通信和信息等各类资源,以服务大众为目的,实现资源共享与协同工作。
在各种犯罪活动中文档伪造是一种常见的伪装手段,由于其易于实施而难于分辨,文档伪造的检测技术显得更加重要而迫切,通过对文档中笔迹改动的检测辨别文档真伪是其中重要的手段。
随着技术的发展,新一代测序技术已经兴起并广泛应用,但传统的PCR片段测序仍非常重要。单核苷酸多态性(single nucleotides polymorphism,SNP)和插入/缺失(insert/deletion,In