论文部分内容阅读
随着智能手机和移动应用技术的发展,活动社交网络越来越流行。在ENSN中,人们可以在线上提前发布组织、线下参加各类活动。然而,由于人们可以自由地在线点击加入活动,其实际线下出席行为通常与线上有所不同。因此,如何对活动的实际出席情况进行准确预测,对活动组织者及活动开展具有重要的指导意义。
已有的活动社交网络中进行出席预测的研究存在着如下几个问题。1.特定活动的预测精确度低,例如室外活动;2.忽视了活动本身之外的相关因素,例如活动举行当天的天气因素;3.部分活动内部因素尚未挖掘,影响人们出席活动的因素很多。针对上述问题,本文提出一种结合天气因素的活动出席预测方法。使用从知名活动社交网络Meetup收集的伦敦与纽约两座城市的大规模活动数据集,研究了影响用户出席活动的潜在因素。本文创新性地将活动持续时间以及天气因素作为对用户出席行为有影响的两个关键因素,并充分了解与探究天气因素对不同类活动的不同影响方式,然后结合基于梯度下降的提升树算法对用户出席活动的行为进行了预测。实验表明,由于在预测模型中加入了天气因素,本文的预测模型实现了较好的预测准确性。
本文的主要贡献总结如下:
1.对天气影响用户出席活动进行深入研究。首先,提取天气因素中的温度、湿度、风向等特征并对其分类,为探究天气对不同类别活动的影响做基础;同时将细粒度的天气因素分为直接及间接影响。
2.确定了一些能影响用户出席活动的关键特征,并进行了全面的提取。这其中包括用户兴趣特征、用户活动距离特征、活动持续时间特征以及天气特征。
3.综合了活动的多种因素并结合基于梯度下降的提升树设计了一个结合天气的活动出席预测模型,即GBT-W。在建模过程中深入探究了负样本的选取。并考虑了真实环境中的不定的天气情况带给模型的影响并为活动组织者介绍了文章模型的具体使用方法。
4.对所设计的模型进行了一个全面的测试,实验表明天气因素对预测模型精度提高的有效性。与此同时基于此预测模型,这个平台可以为一个活动推荐topk个选择(例如时间、地点、天气等)。
已有的活动社交网络中进行出席预测的研究存在着如下几个问题。1.特定活动的预测精确度低,例如室外活动;2.忽视了活动本身之外的相关因素,例如活动举行当天的天气因素;3.部分活动内部因素尚未挖掘,影响人们出席活动的因素很多。针对上述问题,本文提出一种结合天气因素的活动出席预测方法。使用从知名活动社交网络Meetup收集的伦敦与纽约两座城市的大规模活动数据集,研究了影响用户出席活动的潜在因素。本文创新性地将活动持续时间以及天气因素作为对用户出席行为有影响的两个关键因素,并充分了解与探究天气因素对不同类活动的不同影响方式,然后结合基于梯度下降的提升树算法对用户出席活动的行为进行了预测。实验表明,由于在预测模型中加入了天气因素,本文的预测模型实现了较好的预测准确性。
本文的主要贡献总结如下:
1.对天气影响用户出席活动进行深入研究。首先,提取天气因素中的温度、湿度、风向等特征并对其分类,为探究天气对不同类别活动的影响做基础;同时将细粒度的天气因素分为直接及间接影响。
2.确定了一些能影响用户出席活动的关键特征,并进行了全面的提取。这其中包括用户兴趣特征、用户活动距离特征、活动持续时间特征以及天气特征。
3.综合了活动的多种因素并结合基于梯度下降的提升树设计了一个结合天气的活动出席预测模型,即GBT-W。在建模过程中深入探究了负样本的选取。并考虑了真实环境中的不定的天气情况带给模型的影响并为活动组织者介绍了文章模型的具体使用方法。
4.对所设计的模型进行了一个全面的测试,实验表明天气因素对预测模型精度提高的有效性。与此同时基于此预测模型,这个平台可以为一个活动推荐topk个选择(例如时间、地点、天气等)。