论文部分内容阅读
随着面向服务体系结构(SOA)的普及,Web服务数量正在迅速增加,同时导致Internet上存在许多功能类似的服务。这种情况使得用户难以针对给定的应用环境选择期望的Web服务。先前的研究表明,服务推荐技术可以通过用户需求和相关服务之间的精确匹配来有效地解决这一问题。在过去,概率主题模型已经被广泛用于研究从文本服务描述和用户需求挖掘功能语义,然后将其用于功能属性匹配和服务推荐。然而,传统的主题模型(例如,LDA)在具有语义稀疏性的短文本上表现不佳,因此对通常具有有限数量单词的Web服务进行建模也是如此。为了解决上述问题,本文试图采用合适的主题模型,以便从短文本性质的Web服务描述中有效地引出语义,并结合Web服务推荐的多维有用特征,将其集成到深度因子分解模型中,进行有效推荐。本文的贡献总结如下:1、我们提出了一种基于BTM(Biterm Topic Model)主题模型的Web服务聚类方法。该方法首先对Web服务描述文本进行去噪预处理,然后利用BTM主题模型的词对共现模式学习整个Web服务描述文档集的隐含主题,为每篇文档生成主题分布,并使用Gibbs采样方法求解参数。接着利用JS距离计算Web服务文档间的相似度,最后应用K-Means算法对Web服务进行聚类。通过与LDA、TF-IDF等方法进行对比,该方法在聚类纯度、熵和F-Measure指标上均具有更好的效果。实验表明该方法能够有效解决因Web服务描述所具有的短文本性质而导致的语义稀疏性问题,可显著提高服务聚类效果,为后续服务推荐提供了基础性的支持。2、我们提出了一种基于GPU-DMM主题模型的Web服务推荐方法(WDDF)。该方法首先利用英文Wikipedia构建高质量词向量模型以获取语义相似词,并基于DMM主题模型融入GPU促进策略,将语义相似词融入主题推导过中以获取更有效的服务隐含主题。其次,将获取的主题分布向量用以计算相似度,融合Web API相似度、Mashup相似度、Web API共现性以及流行度等多维特征作为深度因子分解机模型的输入,预测评分并推荐Top-N Web APIs。最后,本文采用真实数据进行实验,与现有多种Web服务推荐方法相比,实验表明:该方法在召回率(recall)、准确率(precision)、F值以及归一化折损累积增益(NDCG@N)等方面具有更好效果,能够挖掘更高质量主题,且具有较高推荐性能。