论文部分内容阅读
随着电影产业的飞快发展,越来越多的投资者热衷于电影投资,但目前我国国产电影投资中,只有少数电影投资是盈利的。在这一背景下,对国产电影票房进行预测无疑对风险控制具有巨大的现实意义。电影作为典型的短周期、体验型产品,其票房收益受到众多因素的共同影响,如:电影自身的特征、市场相关因素,并且随着互联网的普及,网络信息也成为影响用户进行决策的重要因素。因此如何结合我国电影产业发展现状构建更为全面的电影票房影响因素指标体系,如何更好的利用网络信息对国产电影票房进行预测是当前我国票房研究的一个重点。基于对研究现状的总结以及行业实际现状,本文构建了一种新的国产电影票房预测模型对目前研究中存在的不足进行改进从而提高票房预测模型的精度:(1)考虑到当前国产电影票房预测模型研究中大都存在数据维度不足的问题,本文从多个维度出发并结合我国电影行业的现状构建了一套较为全面的国产电影票房影响因素体系并在影响因素的量化方法方面更充分的利用了网络平台数据,使得影响因素的量化值更具有时效性;(2)考虑到过多的输入变量会加大模型训练的难度,因此本文在前面的影响因素的基础上,构建基于随机森林的影响因素影响力求解模型,并以此为依据对票房影响因素进行科学的筛选,以此来简化后续预测模型的输入;(3)考虑到不同影响因素对票房的影响力不同的现实情况,为了解决以往研究中对影响因素权重平均分配的问题,本文构建了基于加权K-均值和局部BPNN的票房预测模型,以因素影响力为依据对样本数据进行加权的K-均值聚类,并基于子样本构建局部BPNN模型进行票房预测。最后为了验证本文所构建模型的优越性,采集2016-2017年上映的415部国产电影相关数据,采用本文所定义的量化方法以及模型进行实验,并与基于BP神经网络的国产电影票房预测模型以及基于K-均值和局部BP神经网络的国产电影票房预测模型进行对比,实验结果表明:本文所构建模型的平均绝对百分比误差(MAPE)为8.62%,要低于对比实验基于BP神经网络的国产电影票房预测模型(13.91%)以及基于K-均值以及局部BP神经网络的国产电影票房预测模型(11.16%);相对误差(RMSE)为238.26,要低于对比实验基于BP神经网络的国产电影票房预测模型(516.73)以及基于K-均值以及局部BP神经网络的国产电影票房预测模型(367.41)。可以看出本文构建的国产票房预测模型可以在一定程度上提高票房的预测精度。