论文部分内容阅读
目的:本研究旨在对长春市2007~2016年猩红热的疫情概况进行统计描述,分析其不同时间、不同地区、不同人群的流行特征;同时,采用GM(1,1)模型、ARIMA模型和BP神经网络模型分别对2017年长春市猩红热的发病情况进行趋势预测,并对模型的预测效果进行评估,从而得到最优模型,为未来长春市猩红热的预防和控制提供重要的流行病学依据。方法:本研究中猩红热疫情监测数据来源于“中国疾病预防控制信息系统”,长春市常住人口数据来源于长春市统计局,长春市1:10万数字地图来源于吉林大学地球测绘学院。采用描述性流行病学方法对长春市2007~2016年猩红热疫情进行流行病学分析。采用Microsoft Excel 2007软件对数据进行整合、处理,采用SPSS 21.0软件进行相关资料统计分析,采用Mapinfo 9.5软件绘制地区分布图;以发病病例数、发病率、构成比指标描述长春市2007~2016年猩红热流行特征。采用R软件建立GM(1,1)模型和ARIMA模型,采用Matlab软件建立BP神经网络模型,探索最优模型结构,并分别进行模型检验并对2017年长春市猩红热发病率进行预测。采用平均绝对误差(MAE)和均方误差(MSE)两个指标对以上三个模型的预测效果进行评估。结果:1.长春市2007~2016年累计报告猩红热病例3202例,年平均发病率为4.26/10万,无死亡病例报告。2011年发病率为10年间最高,为8.58/10万。2.长春市2007~2016年猩红热在时间分布上呈现明显的季节性“双峰分布”,第一个高峰出现在5~7月份,第二个高峰出现在10~12月份;在地区分布上,城区发病率(6.79/10万)高于外县(市)区发病率(2.54/10万),高发病率地区主要集中在双阳区(11.61/10万),高新开发区(10.76/10万)和绿园区(9.58/10万);在人群分布上,男性发病例数及发病率均高于同年女性发病水平,男女发病率比为1.55:1,发病年龄主要集中在0~15岁年龄组,学生、散居儿童、幼托儿童为主要发病人群,分别占报告病例总数的41.04%,31.57%,24.02%,共计96.63%。3.采用2007~2016年10年间历史同期猩红热月发病率分别建立相应GM(1,1)模型,2月、8~12月所建立的GM(1,1)模型拟合精度不合格,不能进行外推预测;2017年1月、3~7月发病率预测结果分别为0.218/10万、0.088/10万、0.138/10万、0.250/10万、0.370/10万、0.235/10万。4.采用2007~2016年猩红热月发病率建立时间序列,ARIMA(2,1,2)模型为预测长春市猩红热发病趋势的最优ARIMA模型结构,预测结果显示2017年长春市猩红热1~12月发病率分别为0.295/10万、0.194/10万、0.147/10万、0.193/10万、0.283/10万、0.328/10万、0.291/10万、0.212/10万、0.169/10万、0.198/10万、0.268/10万、0.309/10万,且2017年各月实际发病率均在预测值的95%置信区间范围内波动。5.建立BP神经网络模型中,采用前3年历史同期发病率预测当前月份发病率,综合考虑网络性能、预测效果和模型的简洁性,选择结构为3-9-1的BP神经网络作为最终的预测模型,预测结果显示2017年长春市猩红热1~12月发病率分别为0.321/10万、0.145/10万、0.130/10万、0.131/10万、0.135/10万、0173/10万、0.334/10万、0.162/10万、0.128/10万、0.128/10万、0.143/10万、0.199/10万。6.从可行性来看,ARIMA(2,1,2)模型和结构为3-9-1的BP神经网络都成功地预测了2017年各月的发病率,而GM(1,1)模型只对1月、3~7月发病率成功进行了预测;从预测效果来看,GM(1,1)模型的MAE值与MSE值均为最小,其次为ARIMA模型,最后为BP模型。结论:1.长春市2007~2016年累计报告猩红热病例3202例,年平均发病率为4.26/10万,无死亡病例报告,2011年发病率为10年间最高。2.长春市2007~2016年猩红热疫情呈现明显的“双峰”季节性分布,两个发病高峰分别出现在5~7月份和10~12月份;城区发病率高于外县(市)区;男性发病率均高于女性,以0~15岁年龄组的学生、散居儿童、幼托儿童为主。3.综合比较GM(1,1)模型、ARIMA模型和BP神经网络模型,ARIMA(2,1,2)模型为预测长春市猩红热发病率的最佳模型。