论文部分内容阅读
随着航空运输业的逐渐发展成熟,现代的航空公司也越来越倾向于采用复杂的机票定价模型来最大化公司的收益,这导致实际当中的机票价格频繁出现波动。在没有足够信息的情况之下,消费者往往难以把握价格变动的规律从而做出合理的购买决策。在过去的十几年中,有部分研究曾经尝试通过挖掘机票价格数据来帮助顾客决定最佳的购买时机,然而在这些研究当中,问题大多被描述成了在某一特定时机应该购买还是等待的二分类任务,而对于真正的预测未来具体价格仍然缺乏讨论。另一方面,在工业界也有一些企业宣布能够为顾客提供价格预测或者购买建议的商业服务,然而这些服务大多数在运营一段时间后出于各种各样的原因被先后关闭。并且,由于商业应用的保密性,其采用的算法或系统的设计也未被公开,因此,无论是在学术界还是工业界,机票价格预测仍然是一个亟待探索并具有重大实用价值的研究课题。论文的研究正是在这种背景下展开,旨在通过挖掘机票价格数据,提出一种适用于价格预测的学习算法和一套完整的系统设计方案。研究工作分别从机票数据建模、价格预测算法、购买决策支持以及系统实现四个方面开展。首先,文章分析了机票价格序列的特性,提出了一种基于价格表的数据组织方式,并在此基础上形成一套特征抽取与特征选择的复合流程。随后,文章对现有的增量式集成分类算法Learn++.NSE进行了介绍,针对其存在的不足和长期预测场景下的失效问题给出相应的解决方案,提出一种基于时间上下文的回归预测模型Learn++.TS,通过不同的实验验证了算法在单步预测和多步预测场景下的有效性。在价格预测的基础上,文章对机票的购买决策支持进行了实验性的探索,分别提出了基于预测价格、优化停止理论以及两者综合的多种不同购买策略,并对各个策略帮助顾客节省预算的能力进行了细致的对比和讨论。最后,通过整合以上的理论成果,文中实现了一个完整的机票价格预测系统,并对该系统的框架结构以及各个功能模块的具体设计和实现方案都进行了详细的介绍。