【摘 要】
:
随着网络购物和电子支付的发展,电子优惠券成为了网络消费中常用的优惠手段。不论是新冠疫情期间银行和电子商务平台合作推出的“消费券”,还是每年“双十一”各大电商平台的“满减券”,都极大的带动了消费,对社会经济的发展和平台盈利有着重要的作用。本文则是在这样的背景下,研究优惠券精准发放的方法。不同于目前常用的优惠券使用概率预测,本文从因果推断方法入手,希望解决优惠券精准发放中的痛点——极易命中自然转化的人
论文部分内容阅读
随着网络购物和电子支付的发展,电子优惠券成为了网络消费中常用的优惠手段。不论是新冠疫情期间银行和电子商务平台合作推出的“消费券”,还是每年“双十一”各大电商平台的“满减券”,都极大的带动了消费,对社会经济的发展和平台盈利有着重要的作用。本文则是在这样的背景下,研究优惠券精准发放的方法。不同于目前常用的优惠券使用概率预测,本文从因果推断方法入手,希望解决优惠券精准发放中的痛点——极易命中自然转化的人群,无法将自然转化和受到优惠券刺激而产生转化的人群区分开来。本文基于AB实验数据展开研究,主要目标是预测样本的个体处理效应或者拆分人群使得人群的条件处理效应最大。为了达到这样的目标,本文使用了元学习、基于树模型的因果推断、基于机器学习的因果推断等模型。针对业界可能碰到的单策略人群选择和多策略人群选择两种情况,本文分别做了单干预因果推断和多干预因果推断。在单干预因果推断场景中,本文提出根据业务经验引入用户活跃度或者用户价值作为模型特征。活跃度或用户价值的计算方式是依据关键特征对用户做聚类,将用户类别活跃度或用户价值标签。此外,根据特征的含义对特征做交叉项,使得模型更具有解释意义。接着应用元学习、基于树模型的因果推断、基于机器学习的因果推断等模型输出人群策略。在多干预因果推断场景中,本文对每个实验组建立单干预因果推断模型,得到样本在不同实验组的处理效应估计,再将样本分配到处理效应为正且最大的策略中去。由于该场景下单干预因果推断模型的评估指标不再适用,本文提出了以随机分配的转化和表现最优的实验组的转化为基线的模型评估方法。在实证研究中,本文选取了某优惠券策略的AB实验数据,数据包含一个对照组和两个实验组,分别为无优惠策略、买一赠一券、折扣券。首先,本文对数据做了因果性分析,依据业务经验将用户拆分成不同的亚组,通过亚组分析检验实验组用户的表现是否显著优于对照组用户。通过比例检验,发现实验组确实存在转化率提升不显著的用户群体。在模型变量的选择中,本文引入了基于用户历史消费行为聚类的用户价值类别,并对特征做离散变量间的交叉项以及连续变量和离散变量间的交叉项。接着,本文以无优惠策略组和买一赠一券组为例,进行了单干预因果推断模型的建立,发现元学习中的R-learner、基于KL散度的树模型和基于极端梯度提升树的双机器学习模型效果比较好。此外,对比因果推断模型业界常用的概率预测模型,因果推断能够更好的区分营销敏感人群,实现成本发放效率的提升。最后,本文对数据集做了多干预因果推断模型的建立,并应用本文提出的模型评估指标进行模型评价,发现元学习的效果优于基于树模型的因果推断和基于机器学习的因果推断,其中R-learner的效果更好。综上,本文得到以下三个结论:第一,用因果推断模型来做敏感人群的圈选、实现优惠券的精准发放是行之有效的。相比于业界常用的优惠券使用概率预测模型,该方法能够通过预估个体处理效应更好的区分自然转化的人群和收到优惠券激励而转化的人群;相比于亚组分析,该方法能够适应更多特征的场景。第二,将一些业务经验带入变量选择中是有利于模型建立的,比如依据用户的历史行为做活跃度或用户价值的划分。这些依据业务经验建立的变量,在模型的特征中重要度排名靠前。第三,在多干预的因果推断场景下,本文提出的模型评价方法,通过计算随机分配、选择表现最优的实验组及各模型策略的转化,不仅能够实现模型间的效果对比,更能实现模型效果与业界常用方法的效果对比,有助于更好的判断模型策略的可用性和实用性。
其他文献
改革开放以来,随着我国经济水平的发展,城市化进程的推进,城市生活垃圾产生数量的越来越多,由此引发了大量与生活垃圾相关的问题,给我们的生活环境、生态水平带来更大的挑战,“垃圾围城”成为城市发展之痛。垃圾分类政策的推行有助于提升垃圾的处理速度、保障经济的高速发展、保障生态环境的改善。我国将城市生活垃圾分为可回收物、厨余垃圾、有害垃圾、其他垃圾四类,研究垃圾图片分类算法有助于居民简易、正确的进行垃圾分类
目的:探讨温经养血汤与艾灸疗法应用于子宫内膜异位症痛经患者的效果,以便临床寻找出更有效的治疗方案。方法:选取2019年12月-2021年9月荆门市中医医院收治的子宫内膜异位症痛经患者120例,依据随机数字表法将其分为对照组和试验组,各60例。对照组给予艾灸疗法,试验组在对照组的基础上给予温经养血汤治疗,两组均连续治疗3个月。比较两组临床疗效,治疗前后中医症候积分、血液流变学、血清前列腺素F2α(P
我国的投资市场长期处于个体投资者占据绝大多数的环境中,投资者的情绪对于我国市场经济有着决定性的重要作用。从市场经济运行的角度来看,多数学者都认为,投资者的情绪和收益波动率之间是呈正向相关的,即投资者的情绪愈是高涨,其收益波动率也愈大。本文通过利用文本数据刻画了投资者的情绪,基于异质市场假设提出HARQ-RV-CJ-SENT模型,改善了对已实现价格波动率的预测效果,并从因果检验的角度深入分析了二者之
在当今的大数据时代,指数级增长的文本数据给人工智能带来了更多的可能性,自然语言处理领域逐渐受到更多的关注。随着深度学习的发展,海量数据的自动化处理要求不断提高,如何高效利用非结构化文本信息成为一个紧迫且重要的热点任务。知识图谱、事理图谱等概念也渐渐兴起,事件抽取作为构建知识图谱的重要信息抽取技术,对于其他下游任务具有重要的意义,目前深度学习凭借着强大的自动特征抽取能力,逐渐成为事件抽取的主流研究趋
中国已经顺利走完全面建设小康的道路,并在此基础上将继续向全面建设现代化国家迈进,由此再次将公共卫生安全和人民健康的历史任务凸显出来。新中国成立以来,尤其是十八大以后,中国在公共卫生领域取得了重大成就,困扰贫弱中国多年的各种传染病逐个消灭,人均寿命稳步提升,社保制度日益健全,医疗保健水平显著提升,制度的优越性愈加凸显。但社会主要矛盾的转变在公共卫生领域向理论和实践提出了更高的要求,随着经济社会的发展
当今社会,网络服务已浸透人们生活的方方面面,而维护背后软硬件网络系统安全可靠的运行,以及应对各类突发事件则离不开运维人员的工作。但随着科技的进步,应用系统的规模及复杂程度的提高,传统运维方式逐渐被淘汰。智能运维在应对海量数据时,能更好地运用算法从海量数据中总结规律、提取规则,辅助运维人员做出更优的反应和决策。其中,对运维数据的异常检测技术在推动智能运维的发展具有不可或缺的作用。运维指标时序数据具有
“斗争”和“伟大斗争”,成为党的十八大以来中国共产党治国理政过程中的高频词汇。习近平总书记在2021年春季学期中央党校(国家行政学院)中青年干部培训班开班式上指出:“我们党依靠斗争走到今天,也必然要依靠斗争赢得未来。”1因而,“伟大斗争”既不是一句纯粹的政治口号,也不是国家领袖的凭空创想,它是中国共产党人在漫长的接续奋斗的历史过程中理论创新与实践创新的统一,具有深邃的历史理论根基和现实依据。“伟大
目的探讨加味桂枝茯苓汤联合孕三烯酮治疗子宫内膜异位症痛经的疗效,以及对患者糖类抗原125(CA125)、糖类抗原199 (CA199)水平的影响。方法选取泉州市中医院2017年1月至2019年1月收治的90例子宫内膜异位症痛经患者,随机分为对照组和观察组,各45例。对照组口服孕三烯酮胶囊治疗,观察组在对照组基础上口服加味桂枝茯苓汤治疗,两组均治疗12周。治疗前后,观察并比较两组视觉模拟评分法(VA
深度卷积神经网络的兴起极大地推动了语义分割领域的研究进展,已经有一些成熟的方法应用于医学图像分析、自动驾驶等领域。不过随着研究愈加成熟,深度学习技术也暴露出了弱点。高的分割精度十分依赖于大规模的标注数据,而在许多现实应用场景中,大规模的数据是难以获取的,并且,对数据进行像素级的标注也是高成本的,所以如何基于少量标注数据通过有监督学习来较好地实现语义分割便成了一个亟待解决的问题;同时,现有的基于深度
细粒度情感抽取是指从带有主观情感色彩的文本中,提取出描述目标、观点词以及情感极性三要素的技术,目前在风险管理、个性化推荐等场景下具有广泛应用。在非限定目标域的条件下,本文基于预训练语言模型BERT编码的字向量,引入迁移特征,提出了两阶段情感抽取模型,克服了基线模型中存在的实体边界误判等问题。首先,文本设计了基于序列标注的基线模型。该模型采取流水线思想,分为目标、观点实体抽取以及情感多分类两个独立模