论文部分内容阅读
在这个互联网和大数据飞速发展的时代里,人工智能技术在智能化营销的决策上起到了越来越重要的作用,帮助公司提升用户体验、提高企业竞争力。针对用户的智能化营销有两方面决策至关重要,一个是选择合适的时间,另一个是选择合适的营销方案。本文围绕营销场景下的这两个重要问题展开研究工作。对于营销择时的问题,一个直接的方法就是判断用户的需求,而想要判断用户的需求,就需要预测用户未来可能会做什么事情。在这篇文章中,我们提出了一个新颖的深度学习模型来解决个性化行为序列预测问题。该模型利用一个编码器-解码器结构合理地保留了用户画像特征和历史行为事件序列两部分信息的推断关系,以更合理的方式进行个性化序列预测工作,该结构能够增强模型的灵活性和可解释性。我们还修改了长短期记忆单元(long-short-term memory)的忘记门层结构,提出了一个the attentioned long-short-term memory的变体,以扩大结构的注意视野。这个the attentioned long-short-term memory在IMDB数据集可以达到相似的但是更好的收敛和拟合效果。另外,在合作公司提供的来自真实场景的数据集上,本文提出的模型加上the attentioned long-short-term memory作为编码器的结构可以比传统的长短期记忆单元作为编码器的模型平均预测准确率高出10%左右。本文提出的基于编码器-解码器的个性化事件序列预测模型在实际商业场景的上线实验中也取得了不错的效果。另一方面,因为深度强化学习适合建模现实世界环境,因此我们将强化学习应用到智能营销的个性化推荐决策问题中。一般地,强化学习模型针对每个任务的数据从头开始训练,忽略其他任务上相关的先验知识,这造成了相似场景上大量的重复性工作。然而,一个任务的数据量是很有限的,能够获取的信息有限,且营销场景中每次任务可能都会有新的产品出现,决策的产品集合不完全相同,存在产品冷启动问题。相似任务上的知识共享可以解决这样的问题。元学习是一类强调不同任务间知识共享以解决特定任务的少样本或零样本问题的方法。因此,我们需要融合元学习方法,充分利用先验知识,使得模型在新任务中的效果保持稳定的水平,即使新任务缺少训练数据或存在未出现过的产品。这里,为了解决营销场景中零样本学习和产品冷启动的问题,我们提出了一个基于深度强化学习和元学习的个性化推荐决策模型。从不同场景下的对比实验结果可以看出,该模型能够很好地应对数据缺失情况,在训练数据缺失的情况下依然保持一个稳定的效果。同时,它能够快速适应动作空间的变化,以灵活应用于不同营销方案的活动中去。该模型在现实商业场景中相比对比模型桶提高了 14.6%,达到一个不错的效果。另外,非稳定环境对于深度学习的模型训练和工作都有很大地影响。这里指出了分时段归一化的数据预处理方法可以有效简洁地为模型提供一个相对稳定的工作环境。从实验结果可以看出,这种数据预处理方法可以使环境保持相对稳定,从而使得模型的性能在一定程度上得到保证。因此,我们认为,本文提出的模型可以帮助智能营销的决策更加便捷和有效。