论文部分内容阅读
近年来,随着软件即服务理念的流行和Web服务技术的发展,越来越多的企业和组织将自己的数据和业务以Web服务的形式发布在互联网上,通过向客户和第三方开发人员开放Web服务以增加商业价值。随着Web服务数量的增长和功能的日益丰富,通过有效地组合不同功能的Web服务,可以帮助用户开发功能更加强大的应用或增值服务(例如Mashup)。服务组合已成为一种非常流行的软件开发方式,然而,现实中通过组合Web服务开发软件仍然是具有挑战的任务。一方面,用户对Web服务生态系统中的组合模式缺乏了解,可能无法提出有意义的Web服务组合需求。另一方面,对于互联网平台上的数量庞大的Web服务资源,用户很难快速发现满足自己需求的Web服务。为了解决上述问题,本论文研究Web服务的组合模式挖掘及组合模式感知的服务推荐方法。首先,考虑到Web服务的标签体现了对标注资源的功能概括和描述,通过挖掘服务组合中的标签共现关系来发现服务之间的组合模式,这些组合模式反映了哪些服务功能的组合是比较有意义或有价值的。然后,将组合模式和最新的推荐技术相结合为Mashup用户自动推荐合适的Web服务。本文的主要贡献如下:(1)提出了一种基于关联规则挖掘的Web服务组合模式发现方法(EWACP)。该方法结合了Web服务的标签以及Mashup中的Web服务组合记录,首先使用TF-IDF文本挖掘算法提取Web服务描述文档中的关键词作为新标签对原始标签进行扩展。接着使用StanfordCoreNLP、WordNet字典等工具对标签进行词形还原、同义词统一等处理。最后使用基于FP-growth的Web服务标签关联规则挖掘算法得到服务标签之间的强关联规则,通过对规则过滤进一步得到能准确反映出服务功能关联关系的Web服务组合模式。实验结果表明该方法具有较高的准确性和有效性。(2)提出了组合模式感知的Web服务推荐方法(EWACP-DeepFM)。该方法首先将Mashup和Web服务之间的标签以及Mashup中的Web服务组合记录相结合,使用EWACP方法得到Mashup和Web服务之间的组合模式。接着利用Jaccard相似系数和Web服务的历史调用次数得到Web服务的共现性和流行度。最后使用深度因子分解机模型训练组合模式、Web服务流行度、共现性以及Mashup和Web服务的标签等多维特征信息来学习Mashup与Web服务之间的潜在链接关系,并为目标Mashup推荐Top-N个最佳Web服务。实验结果表明,该方法在准确率、召回率和F值等方面均优于其他对比方法。