中文语义万维网本体匹配

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lianjinshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义万维网(Semantic Web)概念最早由万维网之父蒂姆·伯纳斯-李(TimBerners-Lee)先生于1998年提出。近年来,随着互联网的大热,语义万维网得到了迅猛的发展:其链接开放数据(Linking Open Data)不但从2007年的500万条,猛增500倍,至2010年的250亿条,而且语义万维网方面的技术也被广泛地应用于政府、军事、医疗、搜索等诸多领域。正当语义万维网在全球范围内如火如荼地发展着,中国的语义万维网事业却停滞不前。笔者认为其中有三点原因:第一,缺少中文链接开放数据,即缺少中文本体,以及它们之间的匹配关系。第二,中英有别,传统的基于英文本体相似度计算的匹配算法无法适用于中文本体匹配。第三,无法对匹配结果进行大规模评测。为了解决以上难题,笔者在本文中提出了一套专门用于中文本体匹配的匹配框架。框架中,笔者精心设计了匹配发现方案,匹配推理方案和匹配过滤方案,分别用于寻找中文本体间的种子匹配,以及对种子匹配进行推理扩大和错误过滤。通过将过滤得到的阳性和阴性匹配结果重新反馈到种子匹配,该框架可以对种子匹配进行反复地更新、推理和过滤操作,以最大限度地找到中文本体间的高质量匹配。此外,笔者还设计了一个在线匹配评测系统,用于对框架生成的匹配结果进行大规模人工评测。实验中,笔者从全球最大的三个中文百科网站中提炼出了本体数据,它们随后在匹配框架中进行两两匹配,匹配结果最终由志愿者们进行评测。结果显示:笔者的这套匹配框架在这三个中文本体之间一共发现了135万余条匹配,其中99%的匹配的正确率达到了80%以上。
其他文献
随着无线网络的发展,应用无线环境进行电子商务交易的条件也日益成熟,解决安全问题作为移动电子商务的目前发展的门槛,急需解决。目前,国内外的移动商务研究和应用多是基于无线应
该文首先在介绍CIMS与企业信息化、CIMS组成这个整体环境下,阐述了制造业管理信息系统的发展历程,总结了国内外ERP的发展动态,提出了该课题研究的目的及意义.该文根据CIMS环
该文研究了基于CORBA的智能网业务生成技术,提出了基于CORBA的分布式智能网体系结构.同时该文给出了CORBA平台上智能网业务的系统设计,既提出利用GSL(全局业务逻辑)表、SIB(
通过对PKI系统相关协议和标准的深入研究,我们在实验室环境下实现了一个具有基本证书管理功能的PKI系统。该系统具有签发符合X.509v3格式证书以及证书作废、密钥管理、交叉认
该论文把知识管理的需求和思想融入工作流技术提出了面向知识管理的工作流系统WFSfKM——WorkflowSystemforKnowledgeManagement.经过几十年的发展,产生了很多工作流的定义、
随着机械设备自动化程度的不断提高,在设备运行状态检测的基础上进行智能故障诊断显得尤其重要。但对大型而复杂的设备来说,故障机理的复杂性、故障知识表达的不精确性以及典
数字水印的研究自90年代后方兴未艾,涌现出大批理论成果与实用技术,新的水印嵌入、检测算法,对水印的攻击方法,水印的理论模型,利用水印保护版权的应用系统等层出不穷.然而,
随着国际贸易和跨境电子商务的快速发展,海关税收监管和风险决策需要考虑越来越多的数据来源,在传统结构化数据的基础之上,还需要进一步提取和分析非结构化数据。图像文档是
网络的规模不断扩大,结构日趋复杂,完善的网络管理系统是网络能够可靠而稳定运行的保证,也是进行网络性能分析的依据.该文研究了基于国际网络管理协议的局域网代理技术,包括
本文采用目前工业流行的IP传真解决方案,用UML设计和实现一个包括网关、网守和后台服务器三层结构的IP传真原型系统。文中采用OOA、OOD和OOP方法,应用RUP及逆向工程技术,籍助ROS