论文部分内容阅读
开放服务已成为互联网的重要趋势,越来越多的企业和个人将Web服务发布在互联网上,第三方Web服务不仅成为我们日常生活以及学习工作中不可缺少的一部分,也是未来开放软件的重要基石。从服务数量和使用范围上来看,如今互联网上的Web服务主要分为两大类:以WSDL为代表的传统结构化Web服务和以RESTful为代表的非结构化Web服务。由于RESTful Web服务的简便性、轻量性、可扩展性和安全性,RESTful架构已经成为Web服务的主流技术。然而,不同于以WSDL为代表的传统结构化Web服务,RESTful Web服务没有严格的标准和规则,如何准确有效地识别非结构化RESTful Web服务成为一个重要问题。如今互联网上的Web服务同类型较多,且稳定性、接入方式不一,因此如何实现对已识别的RESTful Web服务进行统一有效地接入整合,也是一个非常重要的问题。针对以上问题,本文提出了一种RESTful Web服务开放平台的实现方案。平台架构主要分为服务发现与识别、服务搜索和服务接入三个模块。在服务发现与识别模块的研究中,提出了一种基于余弦相似度的RESTful Web服务识别方法,通过定义RESTful Web服务特征向量相似度匹配模型,实现了RESTful形式Web服务的快速发现与识别,算法主要步骤包括网页去噪、分词、去除停用词、提取特征向量和特征向量余弦相似性匹配。真实实验数据表明,算法可较好实现对Restful服务的识别,相对传统方法准确率提升5%以上。在服务识别的基础上,设计并实现服务搜索模块,使用全文搜索引擎Lucene为服务库建立索引,然后依照用户提供的搜索关键词,通过索引引擎在索引文件中进行搜索,搜索得出符合用户需求的RESTful Web服务。针对繁杂的服务库,本文基于企业服务总线Mule ESB构建服务接入模块,解决了互联网中各式RESTful Web服务在统一性、稳定性、有效性等方面的不足,实现了对RESTful Web服务的快速接入和整合。