基于BTM和GPU-DMM主题模型的Web服务推荐方法研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户：yc513485587

【摘要】

：

随着面向服务体系结构(SOA)的普及,Web服务数量正在迅速增加,同时导致Internet上存在许多功能类似的服务。这种情况使得用户难以针对给定的应用环境选择期望的Web服务。先前

【作者】

：

陈婷

【出处】

：

湖南科技大学

【发表日期】

：

2004年期

【关键词】

：

Web服务推荐 Web服务聚类主题模型深度因子分解机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着面向服务体系结构(SOA)的普及,Web服务数量正在迅速增加,同时导致Internet上存在许多功能类似的服务。这种情况使得用户难以针对给定的应用环境选择期望的Web服务。先前的研究表明,服务推荐技术可以通过用户需求和相关服务之间的精确匹配来有效地解决这一问题。在过去,概率主题模型已经被广泛用于研究从文本服务描述和用户需求挖掘功能语义,然后将其用于功能属性匹配和服务推荐。然而,传统的主题模型(例如,LDA)在具有语义稀疏性的短文本上表现不佳,因此对通常具有有限数量单词的Web服务进行建模也是如此。为了解决上述问题,本文试图采用合适的主题模型,以便从短文本性质的Web服务描述中有效地引出语义,并结合Web服务推荐的多维有用特征,将其集成到深度因子分解模型中,进行有效推荐。本文的贡献总结如下:1、我们提出了一种基于BTM(Biterm Topic Model)主题模型的Web服务聚类方法。该方法首先对Web服务描述文本进行去噪预处理,然后利用BTM主题模型的词对共现模式学习整个Web服务描述文档集的隐含主题,为每篇文档生成主题分布,并使用Gibbs采样方法求解参数。接着利用JS距离计算Web服务文档间的相似度,最后应用K-Means算法对Web服务进行聚类。通过与LDA、TF-IDF等方法进行对比,该方法在聚类纯度、熵和F-Measure指标上均具有更好的效果。实验表明该方法能够有效解决因Web服务描述所具有的短文本性质而导致的语义稀疏性问题,可显著提高服务聚类效果,为后续服务推荐提供了基础性的支持。2、我们提出了一种基于GPU-DMM主题模型的Web服务推荐方法(WDDF)。该方法首先利用英文Wikipedia构建高质量词向量模型以获取语义相似词,并基于DMM主题模型融入GPU促进策略,将语义相似词融入主题推导过中以获取更有效的服务隐含主题。其次,将获取的主题分布向量用以计算相似度,融合Web API相似度、Mashup相似度、Web API共现性以及流行度等多维特征作为深度因子分解机模型的输入,预测评分并推荐Top-N Web APIs。最后,本文采用真实数据进行实验,与现有多种Web服务推荐方法相比,实验表明:该方法在召回率(recall)、准确率(precision)、F值以及归一化折损累积增益(NDCG@N)等方面具有更好效果,能够挖掘更高质量主题,且具有较高推荐性能。

其他文献

组合剪力墙中可更换组合连梁的抗震性能研究

随着对高层建筑剪力墙性能要求的提升,双钢板-混凝土组合剪力墙得到广泛应用,剪力墙中连梁在抗震耗能方面起到了重要作用,传统的钢筋混凝土连梁耗能性能不佳,且未考虑震后可

学位

可更换组合连梁屈服模式判别式受力机理抗震性能极限抗弯承载力

基于蒙特卡洛的PageRank增量算法研究

网络是表征系统内在联系模式的一种强有力的通用方式。生活中的许多系统都可以抽象成网络数据的形式。随着互联网以及社交网络的快速发展,对于网络的研究和分析也变得越来越

学位

PageRank跟踪蒙特卡洛随机游走动态网络增量

愈合期环境与西瓜接穗对嫁接苗根系生长和糖代谢的调控

植物根系不仅为地上部提供结构支撑,而且能够吸收土壤中的水分和养分,并通过维管组织将水、营养物质和激素等运输到其他组织或器官,供其生长、发育和繁殖。本研究以西瓜“早

学位

嫁接愈合期环境西瓜接穗根系生长糖代谢

功能化层级载硫正极材料的构建及其锂硫电池性能研究

随着国家对新能源汽车重视程度的日益加剧,大力发展高效的电池储能系统已经刻不容缓。传统的插入型锂离子电池的正极材料比容量已达到极限,发展空间不足。相比较,新型锂硫电

学位

硫载体层级结构协同效应正极/阴极锂硫电池

应用CRISPR/Cas9技术构建人参CAS基因和三七DS基因的载体及转化体系建立

基因编辑技术是一种能够对生物体基因组特定目标基因进行定点修饰的基因工程技术,自问世以来广泛应用于植物育种、群体改良、突变体构建等领域。较大田作物而言,基因编辑技术

学位

人参三七CRISPR/Cas9皂苷原生质体

长白山6种主要森林类型地表凋落物燃烧性实验研究

对于森林来说,火灾是主要的灾难之一。森林内的可燃物作为森林火灾的物质条件,其中地表凋落物是森林内可燃物的主要组成成分。吉林省长白山林区植物种类十分丰富,由于气候变

学位

森林类型地表凋落物热解燃烧实验火蔓延

Κ-乘积拓扑下保持连通性映射性质的研究

数字图像分析是数字图像处理的理论基础,而数字空间的结构对建立数字图像分析理论具有关键性作用.在数字空间中通过引入拓扑结构建立邻接关系是数字图像分析中有效的方法,同时数字图像的连通性是数字图像分析中重要的问题.本文在预备知识部分介绍了数字空间中Κ-乘积拓扑、Κ-拓扑范畴(简称ΚTC)、Κ-邻接范畴(简称ΚAC)等概念,并分析了具有-乘积拓扑的二维和三维数字空间中像素的最小开邻域和邻接邻域的结构.在此

学位

数字图像Κ-乘积拓扑ΚA-映射同伦不动点性质几乎不动点性质

银纳米线核壳结构及其聚合物介电材料的制备及性能研究

聚合物基纳米复合介电材料具有优异介电性能的同时还能保持良好的机械性能,被广泛应用于柔性电子、新型显示、生物工程等领域。本文以聚二甲基硅氧烷(polydimethylsiloxane,简称PDMS)为聚合物基体,银纳米线(silver nanowires,简称AgNWs)为填充相的主体,通过引入过渡层防止导电网络形成的方式制备出三种核—壳(core@shell)结构的复合材料:AgNWs@SiO2、

学位

PDMS银纳米线核壳结构介电性能机电性能

新疆野果林苹果小吉丁饲养研究

新疆野果林位于天山伊犁河谷地区,建群树种为新疆野苹果。苹果小吉丁主要危害蔷薇科果树,该虫已在新疆野果林蔓延,大面积为害新疆野苹果林苹果、梨、桃、樱桃、沙果、花红、

学位

苹果小吉丁人工饲养羽化率能量消耗

基于大规模源码挖掘的日志语句级别推荐方法

记录日志是软件开发过程中一种普遍的代码实践,目的是收集软件系统运行时的重要信息,这些信息在软件系统的跟踪调试、缺陷排查、性能优化、重要业务信息备案等工作中都有不可

学位

日志语句级别推荐源代码挖掘机器学习

基于BTM和GPU-DMM主题模型的Web服务推荐方法研究

其他学术论文