个性化捆绑销售推荐系统

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:philiploo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:捆绑销售是商家惯用的销售策略,在电子商务领域,可以根据每个用户个性化数据,可以进行个性化的捆绑方案。该文设计并实现了一个基于用户和商品两方面的个性化捆绑销售系统,并通过对用户购买力分类,计算顾客对推荐出的商品的购买欲望,从而得出优惠的捆绑价格。经过实验验证,该系统提高了商品销售量并获得了更多利润。
  关键词:个性化;捆绑销售;电子商务
  中图分类号:TP311 文献标识码:A
  文章编号:1009-3044(2019)34-0071-03
  1 概述
  捆绑销售作为一种重要的销售策略,能帮助商家扩大销售,增加利润。个性化服务已经是一个互联网服务广泛采用的技术,个性化推荐音乐,个性化推荐商品,个性化新闻推送应用越来越多。将个性化技术与捆绑销售结合起来,可依据互联网获得的用户数据进行针对性更强的个性化定制商品捆绑和定价,可获得更高的销售量并获取更多利润。
  当前针对捆绑销售的研究涉及捆绑销售的经济、管理决策及其影响,以及捆绑销售不同的策略选择。Adams and Yellen[1]研究捆绑模式下的福利水平,并奠定来捆绑销售的重要基础。Schmalensee[2]则考虑了需求连续分布的情况,及分布对企业利润的影响。Wendi Hui[3]考虑了顾客两种异质性,并分析不同情况下哪种捆绑策略更优。则Bitran[4]则提出了一个捆绑组合,并且最优定价。为了更符合顾客心意,Hitt[5]则提出了顾客白定义的捆绑组合方案。互联网发展使得个性化推荐得到广泛应用,个性化捆绑推荐策略变得更为容易和准确。Moran Beladev[6]等提出的捆绑推荐中考虑了顾客个人消费特征对保留价格的影响,以进行个性化定价。Guannan Liu[7]考虑用图来表示物品之间的关系,在此基础上来进行推荐。Tang Lei[8]第一次提出了将推荐商品集做一个整体来进行研究。
  本文提出并设计实现了一个个性化捆绑销售系统,系统由两大块组成,捆绑商品推荐部分和捆绑商品定价部分。捆绑商品推荐部分主要负责分析商品和用户信息,针对用户个性化推荐捆绑商品,而捆绑商品定价模块,对推荐的商品组进行综合定价。
  2 系统模型
  图1为个性化捆绑销售模型。
  系统由两大块组成,捆绑商品推荐部分和捆绑商品定价。捆绑商品推荐部分主要负责分析商品和用户信息,針对用户个性化推荐捆绑商品,而捆绑商品定价模块,对推荐的商品组进行综合定价。
  推荐部分主要由三个模块构成,商品模块、用户模块、推荐计算模块。商品模块和用户模块主要作为推荐的数据处理,推荐计算模块则是数据的计算,按照公式得出结果后,以TOP-N的方式向用户推荐前N项捆绑商品。
  定价部分则由用户行为模块计算的用户行为,及推荐的TOP-N商品,个性化定价模块计算出推荐商品的捆绑定价。
  2.1 商品模块
  该模块主要功能有两块,一是筛选和转换商品数据,生成推荐系统能直接使用的lson数据,不同电商网站对商品的处理也不同,推荐系统建立中间层转换商品数据,之后的运算则不需要担心数据格式问题。二是依据商品数据计算商品杰卡德相似系数。商品杰卡德相似系数的计算需要将商品的一些属性标签化,这些属性包括商品自有属性和关于用户行为的属性。
  部分属性可以直接转换为标签,比如商品的分类,在该推荐系统中,商品分类有三个层次,都可以直接作为商品的标签,部分属性则需要进行处理,比如价格,可将价格细分等级作为商品标签,等级的价格的跨度逐渐增大。用户行为也能作为商品标签的一部分,根据商品访问次数和购买次数,可以将商品的热度分级,再将商品热度增添至商品的标签中。
  某些电商网站可供用户自定义商品标签,此类标签为大部分用户所承认,可以直接用作杰卡德相似系数的计算,商品的标签可以随时拓展和更新,以满足不同电商系统的需求,以及应对可能出现的特殊商品。
  2.2 用户模块
  用户模块主要做用户画像分析和用户皮尔逊相关系数计算,用户的购买行为,按商品的分类进行统计,作为计算用户皮尔逊相关系数的主要依据,用户画像则主要用于捆绑商品的定价,使用户对捆绑商品有较大的购买欲望。
  用户画像分析的主要数据来源是用户行为,包括了购买记录、手机型号、手机系统、ip地址等数据,用户画像是动态的,所以也需要能随时更新与拓展。
  2.3 推荐计算模块
  推荐计算模块主要负责统计用户的购买数据,为计算商品杰卡德相似系数和用户皮尔逊相关系数提供依据,还有商品捆绑支持度和商品捆绑置信度的计算,该模块不对用户信息和商品信息进行任何调整操作,只进行数据统计和计算。
  用户的购买数据也需要进行筛选,不能盲目地收集用户所有的信息,比如商品的集中频繁购买,少量数据的计算结果可能会有较大误差,但是垃圾数据和异常数据则可能直接导致计算结果错误,所以统计时需要有目的的筛选,筛选的规则是需要不断更新变化的,在统计过程中要预留拓展筛选的功能。
  2.4 用户行为模块
  用户行为模块主要用于补充用户画像。用户行为中包含了大量的用户信息,比如性别,购买记录和浏览记录的统计结果判断倾向,根据常用收货地址或者用户ip地址判断用户地区,以及根据用户的购买记录等判断用户购买力,根据当时未购买,短期内浏览或购买推荐商品辅助判断用户兴趣。
  2.5 捆绑商品定价模块
  捆绑商品的定价,可用收益期望来衡量是否最优。优惠的程度和用户购买的倾向是成正比的,用户购买欲望可以用指数函数来表示,我们认为价格的变化对购买概率的影响刚开始比较剧烈,随后变得平缓,这与指数函数分布的图像极为相似。当用户购买数据过少时,可从用户画像分析可推测用户的购买力区间,购买力区间是计算用户购买概率的重要因素之一。用户购买概率与捆绑商品利润的乘积,得到收益期望,计算得到最大的收益期望时的定价作为最终推荐捆绑商品的定价。   3 捆绑推荐策略
  3.1 商品推荐策略
  常用的推荐算法有基于内容[10]的推荐、基于内容的协同过滤、基于用户的协同过滤[9]、基于标签的推荐等。在本文中,推荐算法一共使用了两种算法,基于商品属性的内容的推荐算法、和用户协同过滤推荐算法,通过计算用户相似度为用户分组,利用用户协同过滤,只统计相似用户的行为,计算商品置信度和支持度。
  基于用户的协同过滤算法的主要推荐依据是用户皮尔逊相似系数,皮尔逊相关系数广泛用于度量两个变量之间的相关程度,其值介于一1与1之间。用户协同过滤推荐则计算用户的皮尔逊相关系数,通过统计用户购买行为,得到用户在每一个商品分类的购买次数,结合部分用户画像属性,比如性别,男生置为1,女生置为0,得到用户的相似矩阵,进行皮尔逊相似系数计算,最终得到相似度较高的用户组,再依据用户组中用户尚未接触的商品,进行捆绑商品置信度和商品支持度计算,按照80%置信度权值和20%支持度权值计算进行排序,获得新一组推荐商品,与上述基于商品内容的推荐算法得出推荐结果混合推荐给用户。
  设E为数学期望,cov为协方差,σ为标准差,μ为均值。皮尔逊相关系数计算公式如下所示。
  基于内容的推荐算法的主要推荐依据是商品杰卡德相关系数和捆绑商品置信度,计算商品杰卡德系数的指标有商品一级分类、商品二级分类、商品三级分类、商品品牌、价格等级、商品热度等级。
  商品热度的统计依赖于用户的购买与浏览,用户购买行为相比于浏览更能表现商品热度,在统计热度时,购买行为的权重是浏览行为的两倍,商品的热度分为两种,总热度和实时热度,总热度需统计所有的用户行为数据,而实时热度只统计最近一周内的用户行为数据。
  把商品标签放入集合中,得到商品的两个集合A和B,他们的交集元素的个数,在他们并集元素的个数中所占的比例,称为这两个集合的杰卡德相似系数。
  杰卡德相似系数计算公式如下所示。
  商品捆绑置信度为商品捆绑销售的可信度,揭示了用户购买A商品时,会不会同时购买B商品,如果会则其概率是多少。
  商品捆绑支持度则为同时购买了A商品和B商品的用户比率,支持度没有先后之分,即A商品对于捆绑B商品销售的支持度,与B商品对于捆绑A商品销售的支持度是一样的。
  捆绑商品置信度则是衡量是否能进行捆绑销售的重要依据,但依赖用户行为数据,当商品成交记录很少时,置信度和支持度误差极大,所以用户行为数据少时需要降低捆绑商品置信度对于推荐商品排序的权重。商品置信度是指购买了两种商品的人与购买了其中一种商品的比值。支持度是只同时购买了A和B的人数在总分的比例。
  捆绑商品置信度C和支持度S的计算公式如下所示:假设捆绑商品的杰卡德相似系数为J,置信度为C,支持度为S,总用户数为U,总购买记录数为N,总商品数为G,商品热度为H,当用户行为数据过少时,商品置信度与支持度误差较大,α为调整参数,当用户行为过少时降低置信度与支持度权重,排序的计算公式如下所示。
  按计算结果从大到小排序,值越大,推荐度越高,以TOP-N的形式推荐给用户。
  3.2 捆绑定价策略
  在定价策略中,用户购买力是一个重要参考指标。本文将用户的购买力分为六个层次,从低到高依次是:低、较低、中等、较高、高和超高。在计算用户购买力时,只计算了商品的大类。对于那些用户数据很少的用户,通过将用户分类,形成用户组的方式来预测他们的购买力,用户组的聚合主要是从两个维度,一是用户自身的属性,地域、性别、年龄等,二是用户浏览和购买记录。
  用户购买力等级影响用户的购买欲望,当用户购买力等级越高时,价格对于用户购买欲望的影响相对减少,用户购买力等级高,其购买欲望下降得越快。
  在不同的商品分类下,不同的价格代表了不同的购买力,比如一千元的T恤是高端的消费,但是一千元的电脑是非常低层次的消费,所以首先需要计算每个商品分类下各个购买力层次对应价格区间。本文系统将商品分类下所有商品价格从低到高排序,按照20%、30%、30%、15%、4%、1%,的比例分成六个层次,为每一件商品打上消费层次标签。
  当用户购买数据过少,无法分析用户购买力等级时,通过用户画像寻找相似用户,使用前10位最相似用户的购买力等级均值作为该用户的购买力等级,用户相似度用皮尔逊相似系数衡量。
  捆绑商品的定价主要计算捆绑商品的收益期望。在购买捆绑商品时,可认为用户绝对理性的,设商品A的价格为a,商品B的价格为b,用户在商品A收到与商品B的捆绑购买推荐时,当捆绑价格为a,用户购买的欲望无限趋于100%,当捆绑价格为a b时,因为用户可以单独购买,所以此时用户购买捆绑商品组的欲望无限趋于0,符合指数函数的特征。在实际处理中,我们从两种商品中最小值变化到Pa Pb即两种商品的价格之和。
  用戶的购买力等级为n,用户对于捆绑商品价格为p时,幅度为7-n,购买欲望d的函数公式如下所示。
  4 案例分析
  我们将该系统用于国内微型某电商网站。用户数据57000条,商品数据8430条,商品一级分类28种,商品二级分类176种,商品三级分类715种,用户行为数据10141条,用户购买记录57000条。
  运行该系统后,根据测试数据,我们对该系统的准确率、召回率、覆盖率、发现性、上新率等等各方面的指标进行了测试。
  基于TOPlO测试结果显示,个性化捆绑销售系统在召回率、精确率、覆盖率、这三种评价指标上表现如表1所示。
  5 结论
  我们提出的这种捆绑推荐系统能提供用户购买力来进行用户分层,从而进行个性化定价,使商家能够扩大销量,并且在同种商品上可以获得更大利润。但系统用于测试数据量仍然较少,该电商属于微小型电商,购物数据不足,测试结果在更大应用场景下可能显示不同效果。捆绑销售的推荐精度相对难求,因为目前该电商的商品捆绑较少,我们的测试也未完全反映出客户在收到捆绑销售推荐信息时他们的反映情况,可以预料的是顾客收到信息,有可能引起对商品的关注,并且因为优惠的价格从而购买捆绑销售,则实际数据应该比测试数据更为乐观。但因为数据不够充分,所以对用户信息挖掘不够充分,将来的研究希望在足够数据支持下,挖掘到更大用户信息,以进行更为精确地推荐。也期待该个性化捆绑上线后能够获得更多数据来检验实验结果。   参考文献:
  [1] Adams W J,Yellen J L.Commodity bundling and the burdenof monopoly[J]. Quarterly Journal of Economics, 1976, 90(3):475-498.
  [2] Schmalensee R.Cauddian demand and commodity bundling[J].journal of business ,1984,57(1):58-73.
  [3] Wendy Hui, Byungjoon Yoo, Vidyanand Choudhary,et al.Sellby bundle or unit?: Pure bundling versus mixed bundling of in-formation goods[J]. Decision Support Systems, 2012(53):517-525.
  [4] Bitran G R,Ferrer J C.On pricing and composition ofbundles[J].Production
其他文献
摘要:进入21世纪,知识经济成为社会发展的主要趋势,新能源企业是推动能源产业变革的关键载体,是我国发展战略性新兴产业,随着经济全球化发展,全面预算成为企业内部管理的有效工具,为企业战略实施,资源配置提供了系统保障。很多企业全面预算管理中存在很多问题,影响了全面预算管理效果。该文以某新能源公司优化全面预算为案例,阐明新能源企业全面预算管理策略。  关键词:企业战略;预算绩效;新能源企业  中图分类号
摘要:随着以计算机为代表的互联网科技的迅猛发展,计算机技术已经成为促进当前经济社会发展的核心力量。以计算机软件应用为主的相关职业岗位成为当前社会中的高薪领域。高中学校普遍都开设了计算机技术课程,将对学生掌握和应用计算机技术具有良好的促进作用。但是也不能否认,当前我国高中计算机教学中出现了很多的新情况和新问题,作者在本文就当前高中计算机课程教学高中出现的新情况和新问题展开了论证研究,并对此提出具体的
摘要:递进式教学作为积极职业教育的一种教学模式,倡导学生自主学习和协作探究。它包括六个教学环节,通过各教学环节层层递进的螺旋式提升,让学生从模仿练习开始,在愉悦的学习环境中,历经知识的讲解和提升练习,最终实现对知识和技能的理解与掌握,并逐步培养学生的学习能力、合作探究精神和创新思维。  关键词:中职;递进式教学;教学设计  中图分类号:G642 文献标识码:A  文章编号:1009-3044(20
摘要:本文主要介绍了在ADDIE教学模型下,对数据库的内容按照不同要求分层次设计,分为基础内容、中级内容和高级内容,层次间递进提高,每一部分教学内容都给出了相应的教学目标,并根据高职学生的特点以及当前信息技术的发展,以“就业为导向”,培养学生的应用技能为目标,从而采用了MOOC 传统课堂进行混合教学设计的过程。通过实践,对提高课堂管理和学生成绩均有一定效果。  关键词:ADDIE教学模型;MOOC
新工科背景下,许多本科实践课程存在教学内容与社会需求脱节、学科交叉不足、实验设备过时等问题。电装实习为电工电子专业传统的专业基础实践课程,论文从学科交叉、工艺传承
摘要:目前,运营商对通信设计的要求越来越高,传统的生产模式遇到一定的瓶颈,该文从通信工作者角度,阐述信息化软件实现管理与生产协同的一些想法,供通信从业管理和生产者参考。  关键词:协同平台;软件;工具;流程  中图分类号:TP319 文献标识码:A  文章编号:1009-3044(2019)34-0064-02  1 概论  随着网络的发展,运营商对通信设计的要求越来越高,设计工作量越大越大,工作
从“互联网+”背景下软件开发类课程的教学现状分析存在的问题,如学情差异性、学时少内容多、课堂教学模式较单一等,提出一些软件开发类课程的教学改革的措施,主要对课前课中
摘要:当前计算机基础课程教学在普及教育方面还不能有效满足实际需求,存在着教学内容和考评体系不合理、教学实践渠道不足等问题。教师在实际教学环节中只注重知识的传授忽略了不同学生之间的个体差异,不能保证各个基础的学生都匹配到适合他们的教学方式。混合式教学模式是将“线上”教学远程学习与传统教学课堂面授进行有机融合,这需要培训教师具备混合教学能力,从课前准备、课上教学、课后复习以及师生考评体系等四个方面对计
摘要:社区戒毒康复治疗加强了对戒毒康复人员的监督和管理,对降低复吸率有积极的作用,但现今社区戒毒康复治疗模式是由人工管制,工作效率低,信息传递慢,信息时效性差,不利于社区戒毒康复治疗的健康、快速、规模化发展。因此建立一個以社区为纽带的系统化戒毒康复平台,将政府、公安、街道、社区机构、社工、吸毒人员都纳入系统当中,各方共享戒毒康复信息,保持即时沟通联系,实现资源整合运用,使各项工作无缝衔接。通过戒毒
摘要:评述了《计算机导论》课程在计算机科学与技术专业的重要性,提出从导思想、导知识、导方式、导能力、导就业五个方面来探讨民办高校计算机专业《计算机导论》课程的教学内容及教学方法,为后续课程打好基础。导思想主要是针对大一新生从专业学习兴趣方面来进行;导知识主要介绍这门课程所包含的主要内容;导方式就是对学生学习方式的引导;导能力主要引导学生各方面能力的发展;导就业主要是通过这门课让学生了解将来就业的方