论文部分内容阅读
Web服务是一种基于互联网的开发和访问模型,允许用户使用服务提供商在网络上发布的服务,集成到自己的应用程序中。可以从根本上解决跨组织、跨企业的异构系统之间互操作和互通信的问题。随着越来越多的Web服务部署到互联网,如何发现合适的Web服务变得更为重要,传统的Web服务发现基于中心UDDI。这种方式为Web服务发布提供了不少方便,但是也存在着几个方面的问题,首先,UDDI注册库中可能没有包含实际存在的某个Web服务,其次,这种方式基于关键字匹配发现Web服务,这样发现的Web服务,查全率和查准率都会受到极大的影响。本文针对这两点问题,提出了一种基于搜索引擎和语义的方法。其目的在于建立一个Web服务发现领域的垂直搜索引擎,并将语义特性融入其中,这种Web服务发现方式能较好克服目前基于UDDI发现方式的弊端,提高Web服务发现的效率、查全率、查准率。本文所作的主要工作如下,(1)分析了国内外有关基于搜索引擎方式发现Web服务的研究现状和存在的问题,介绍了Web服务、Web服务核心协议、Web服务发现、搜索引擎、语义Web等相关技术。(2)实现了基于搜索引擎的Web服务发现方式。从互联网上抓取网页、解析网页内容、提取可能包含Web服务链接的网页并解析其中WSDL链接地址、抽取WSDL文档中具有代表性的元素,建立Web服务索引,以搜索引擎方式实现Web服务发现。(3)将语义特征融入搜索引擎。搜索引擎在本质上是基于关键字的,为了使搜索引擎具有语义特性,在研究Lucene内部的分析、索引和搜索机制的基础上,在用户搜索Web服务阶段应用查询扩展,以此提高服务发现查全率和查准率。(4)改进并实现一种查询扩展算法。首先提出了切词的概念,切词的目的在于将物理上的一个单词拆开成若干个逻辑上独立的词汇单元,本文实现了一种切词算法。查询扩展算法分成两个阶段,第一个阶段根据同义词扩展,将用户搜索关键字的所有同义词扩展到到查询中;第二个阶段是在此基础上,基于领域本体计算本体概念之间的语义相似度,根据量化的语义相似度进一步查询扩展,将满足一定条件的概念加入到查询之中。(5)提出一种基于搜索引擎和语义的Web服务发现模型(Web Service Discovery Model Based on Semantic and Search Engine, WSDMBSSE),它以互联网上的WSDL文档作为搜索空间,不再依赖任何一个UDDI注册中心,同时,语义方面的查询扩展使得WSDMBSSE能提供更好的查全率和查准率,而且,它也提供了较高的服务发现效率。本文详细介绍该模型的层次结构,以参与该模型的角色为出发点,阐述了模型的执行流程。基于该模型构建了基于搜索引擎和语义的Web服务发现门户原型系统(Web Service Discovery Portal Based on Semantic and Search Engine, WSDPBSSE),并选取了典型数据测试,对实验结果进行了相关分析。本文受到武汉市国际合作项目:“基于语义的可视化服务发布与匹配平台的研究与实现”(项目编号:200970634269)的资助。