论文部分内容阅读
商品销量预测的准确性关乎着所有利益相关者的利润。但是缺货和库存积压的现象普遍存在,这使零售商面临两难境地:他们需要平衡缺货带来的损失和安全库存所需的成本。在这种情况下,非常有必要对商品销量预测进行深入的研究。研究人员可以使用数据挖掘技术来开发预测商品销量的模型,帮助零售商从大量的商品销量数据中挖掘出潜藏的商业价值。其中,不同于传统的监督学习方法,神经网络无需大量的人工特征,就可以从数据中发现隐含的内部规律,从而进行有效的特征学习,在解决短期商品销量预测问题上具有天然的优势。LSTM(Long Short-Term Memory)模型在每一个时间步的输入如果能包含更丰富的历史信息,模型的预测性能也将得到提升,所以在LSTM模块前加一个特征提取器显得尤为重要。以两层的LSTM模型为例,第一个LSTM模块就相当于一个特征提取器,但隐藏层中细胞状态的不稳定性会在一定程度上影响输出特征的质量。基于此,本文提出了一种基于WaveNet-LSTM网络的商品销量预测模型,模型利用WaveNet网络提取时间序列上的特征,然后输入到LSTM模块进行预测输出。具体的,模型通过叠加多层扩张的因果卷积来提取时间序列上的特征,由于卷积的平移不变性,可以使网络提取到的特征更具鲁棒性;再通过跳过连接将每一层的中间结果进行叠加输出,实现了局部和全局特征的组合,将这些特征作为LSTM模块的输入,可以使LSTM模块中每个时间步的输入包含丰富的局部和全局信息,有利于模型进行有效的学习。针对时间序列的商品销量预测问题,本文将基于WaveNet-LSTM网络的商品销量预测模型在真实数据集上进行了实例应用,并将其与LSTM等预测模型进行了实验对比。在这一过程中,本文对所获数据集进行了详细的可视化分析,并且详细描述了从数据处理到实验验证分析的整个流程。实验结果表明,WaveNet网络能够有效地提取时间序列中的特征,将其与LSTM网络结合进行预测,能提升模型的预测准确性。