移动应用推荐—从算法到服务若干关键技术研究

被引量 : 0次 | 上传用户:zl9881123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动计算飞速发展。为了方便用户使用智能移动设备和访问移动网络中的信息服务,移动应用的数量急剧增长,以致于催生了新的巨大挑战:在持续增长的海量移动应用中,用户越来越难以依靠自身的力量,发现满足自己兴趣或需求的应用。为了面对这个挑战,学术界和工业界都将目光聚焦到了一个新的研究方向:移动应用推荐(RMA,Recommendation of Mobile Apps)。RMA将推荐的理论、技术和方法应用到了新的移动计算环境中,来帮助数十亿的移动用户发现他们感兴趣或需要的移动应用。据此,移动计算新的发展催生的这一新的研究方向具有重大的学术意义和重要的应用价值。然而,RMA是新生方向,初步发展,成果欠缺。因此,本文对RMA展开了系统的研究、设计和实现。本文的主要研究内容和创新成果有:1.RMA关键技术提出和分析:RMA处于初步发展阶段,研究缺乏系统性。为此,本文为RMA提出了新的研究框架。该框架依次覆盖了移动应用推荐从生成到使用的生命周期的各个环节,分析了其中的关键研究对象,即推荐算法、推荐系统、推荐链接和推荐服务,并基于它们提出了RMA研究中的关键技术:移动应用推荐算法设计和研究、移动应用推荐系统研究和实现、移动应用推荐发布研究和设计,以及移动应用推荐服务设计和研究。本文还分析和归纳了推荐研究中各要素在移动应用推荐背景下的特殊属性。这些特殊属性决定了RMA研究区别于传统推荐研究的特性,也决定了关键技术研究中新的机遇和挑战。根据RMA研究框架,基于RMA研究特性,本文确立了对RMA关键技术开展研究的具体内容。2.移动应用推荐算法设计和研究:现有移动应用推荐算法主要依赖于用户对移动应用的访问经验,受到了用户经验有限的限制,无法提供全局最优的推荐。同时,现有推荐算法主要生成单目标的应用推荐,只能满足单一有限的应用需求。针对以上问题,本文首先基于元数据潜在语义分析的方法设计了新的推荐算法RA-LSA(Recommending Algorithm based on Latent Semantic Analysis),通过挖掘移动应用元数据中的潜在语义来获取移动应用的相似性度量,从而计算出全局最优的应用推荐。接下来,本文采用多样性测量的方法将RA-LSA算法和现有算法进行比较,揭示了不同算法的不同优势和不足,指出了混合式算法设计的潜力。据此,本文进一步采用多目标的思想和排列聚合的方法,设计了新的混合式推荐算法RA-MRA(Recommending Algorithm based on Multi-objective Rank Aggregation)。该算法通过融合不同算法的优势,生成了面向多目标的应用推荐,从而满足了多种应用需求。基于自主采集的包含103348个应用的实际数据集,本文通过评估实验表明,融合了RA-LSA算法和现有算法的RA-MRA算法以67.2%到494.1%的增幅,有效地提高了应用推荐的质量。3.移动应用推荐系统研究和实现:由于缺乏有效的敏捷开发框架,第三方开发者在缺乏大规模数据的情况下难以开发有效的移动应用推荐系统。这导致了移动应用推荐系统发展缓慢,落后于移动应用的高速增长。针对该问题,本文基于多系统协作的思想,设计了新的移动应用推荐系统开发框架DF-MSC(Development Framework based on Multi-System Collaboration)。该框架不仅集成了不同系统的算法特性,还拓展了开发者所持有的支撑数据,从而降低了系统设计和开发的门槛。在此基础上,为了有效地实现DF-MSC框架,本文采用基于集合的粒子群优化方法,设计了DF-MSC框架下的多系统协作算法CF-SPSO(Cylinder Filling Set based Particle Swarm Optimization)。该算法基于多个源系统的推荐,计算出更优的应用推荐。本文基于三个流行的推荐系统,自主采集大规模的实际数据(108329个移动应用),实现多个验证系统,开展了评估实验。评估结果表明,本文的DF-MSC框架和CF-SPSO算法能以可靠的问题解决率(平均问题解决率>80%)和系统性能(平均迭代次数<30)生成比源系统更优的应用推荐(平均增幅>35.6%)。4.移动应用推荐发布研究和设计:移动应用推荐在生成之后,被以推荐链接的形式发布给用户。这些链接直接引导用户发现移动应用。因此,移动应用推荐的发布(D-MAR,Distribution of Mobile App Recommendation)对于用户发现应用的效率十分重要。然而,现有工作对此缺乏相关的研究。为此,本文提出了移动应用推荐网络(MARNet,Mobile App Recommendation Network)的概念,建模了D-MAR,并基于自主采集的实际数据(包含了103348个移动应用),构建了两类实际的MARNet,即ARNet(App Relationship Network)和UNNet(User Navigating Network)。通过对ARNet和UNNet进行测量和分析,本文指出了现有D-MAR在引导用户发现移动应用中的不足。为此,本文基于MARNet的网络特征度量,即强连通分部(SCC,Strongly Connected Component)数量和节点间最短平均路径长度(APL,Average Path Length),定义了D-MAR的移动应用发现效率(MADE,Mobile App Discovery Efficiency),并对提高D-MAR中MADE的问题进行了建模。针对该问题,本文设计了两类UNNet重构方案SCC-APL和APL-SCC。基于自主采集的大规模实验数据,本文的评估实验表明了,两类UNNet重构方案分别以49.4%和268.6%的增幅,从不同角度提高了现有D-MAR的MADE。5.移动应用推荐服务设计和实现:移动应用飞速增长,移动设备中安装的应用也极大增加,以至于大大超过了设备桌面的有限显示能力,导致用户需要跨越多个虚拟屏幕才能找到自己要使用的应用。这带来了新的信息过载的挑战,即移动应用使用过程中的应用发现的挑战。针对这个挑战,本文提出,移动应用推荐服务的设计不但要基于应用仓库中的应用,面向应用的浏览和安装行为;还要基于移动设备中的应用,面向应用的使用行为。为此,本文设计和实现了新的移动应用推荐服务UMARS(Usage oriented Mobile App Recommending Service)。该服务定义和挖掘了三类用户移动应用使用模式(MAUP,Mobile App Usage Pattern)。基于这些MAUP,UMARS预测用户将要使用的应用,并动态地将应用预测更新到设备桌面上,推荐给用户使用。UMARS使得用户只需要在桌面上就可以直接发现自己想要使用的应用,克服了应用发现的困难,同时提高了移动设备桌面有限空间的利用率。本文征集志愿者对UMARS进行了基于真实使用的评估实验。经过13位志愿者27+天的使用,实验采集了122547条使用数据。这些数据表明,UMARS以可靠的预测命中率(>87.3%),有效地解决了移动应用使用中的应用发现问题。
其他文献
根据深圳市全市水土流失斑块的调查资料和产沙观测结论,通过选取水土流失主要影响因子:地形、植被、降雨、土壤、城市化人为影响因子,建立侵蚀量与这些影响因子之间的多元回
以低碳经济为背景,通过公路运输与铁路运输二氧化碳排放量比较,研究了发展集装箱低碳运输的途径,并结合财政部与环保部关于征收碳排放税的提案,得出集装箱海铁联运可为企业节
"营改增"是我国税制改革的重大步骤,文章通过论述"营改增"的原因和意义,肯定了营改增的重大作用。首先,进一步对服务业、融资租赁业、制造业等企业的税负分析,从而说明了"营
本文结合赊销风险的特征,提出将"赊销风险度"作为新的赊销风险度量标准,该标准以赊销客户的平均货款回收率为计算基础,不仅能够区分赊销资金将来是否发生损失,还能够具体测度
近二、三十年来,国内就符号和语言的任意性和象似性问题时有争论。本文认为许多问题有待梳理和深入研究。例如,任意论者所谈的符号是语言符号,而象似论者所谈的符号具有包括
云计算是信息时代的伟大构想,云计算的创新计算模式可以使用户通过互联网随时获得无限的计算能力和丰富的信息服务。虚拟化技术是支撑云计算的基石,在大规模数据管理和方案交
本文评述了近百年来“红学”概况,指出这门学问本身带着巨大的悲剧性。够得上学术的“红学”,是自胡适《红楼梦考证》开始。鲁迅对《红楼梦》识解之高明远过当时流辈,为“红学”
中小企业是我国经济发展中一支重要力量。然而,当前中小企业内部控制存在诸多问题,对企业参与市场竞争和生存构成了威胁。本文针对这些问题提出了相应的对策。
农村基层组织建设和基层社会治理能力建设是推进国家治理体系和治理能力现代化的重要一环,占有举足轻重的地位,关系到党在广大农村基层的执政基础问题。党的十八大正式提出社