论文部分内容阅读
CPI反映了居民消费特定产品与服务的价格变动水平,对国家的宏观调控政策起到重要的参考作用,也反映了通货膨胀水平和民生状况。国家统计局一般是在每月15日左右公布上个月的CPI数据,CPI数据具有滞后性,因此CPI的预测问题受到了众多研究人员的关注。传统预测CPI的方法大多采用时间序列、神经网络、组合预测等方法,预测CPI的数据大多使用CPI的历史数据和与CPI有关联的宏观经济指标。然而大数据为CPI预测赋予了新的内容。随着互联网的发展和普及,消费需求和购买决策中间新增一个重要的阶段-查询信息。消费者通过互联网查询信息的同时互联网将消费者的行为记录下来,形成数据,这些数据隐含着巨大的价值,为研究各种经济现象和经济活动提供了基础。百度搜索指数在互联网时代应运而生,记录了网民的行为数据,在百度指数搜索框中键入关键词,可以得到该关键词的搜索指数曲线。选取2008年1月至2015年4月的CPI月度数据为因变量,通过介绍消费者行为理论说明了使用百度搜索指数对CPI进行短期预测的可行性。从贝叶斯的角度阐述如何对CPI进行预测,在采用相关系数法选取关键词的基础上运用Spike-Slab先验进行变量选择,Spike-Slab变量选择方法能够更加稳健并自动地进行变量选择,运用马尔科夫链蒙特卡洛模拟CPI短期预测模型的参数,对模拟的马尔科夫链进行分析并建立最优分布滞后模型。分析结果表明基于CPI短期预测模型对2014年5月-2015年4月的CPI进行预测,CPI的预测值相对于真实值的波动不超过1.6%。模型中的解释变量包含了除了烟酒及用品外的其他七类商品,其中食品类和居住类商品只有当期变量,对CPI影响的持续期比较短,而其他的五类商品包含一阶滞后或者二阶滞后变量,对CPI影响的持续期较长。百度搜索指数能够实现对CPI的实时监测。