论文部分内容阅读
研究背景
已有研究显示气象因素可以通过影响病原体的繁殖能力和生存时间、改变传播媒介的地理分布范围以及改变人群对疾病的易感性等方式影响传染性疾病的传播规律和流行特征。据估计,2016年在全球范围内约有212438人因感染菌痢而死亡,30%的死亡发生在5岁以下儿童。我国菌痢发病数仍处于较高水平,其发病数呈现季节性升高的特点,提示菌痢的发病可能与气象因素有关。
菌痢同其他传染病相似,存在空间聚集性。但目前的研究多采用多元回归分析、分布滞后非线性模型(DLNM)等方法从时间尺度量化气象因素与菌痢发病的关系,鲜有在考虑菌痢发病空间自相关性特点的基础上,研究气象因素对菌痢发病的效应。此外,现有气象因素与菌痢发病关系的研究结果并不一致。气象因素对菌痢发病的效应具有地域性分异,但相关研究对二者间可能存在异质性来源未作深入探讨。
当前传染病预测领域常用的统计模型有季节自回归移动平均模型(SARIMA)、广义相加模型(GAM)、回归树、支持向量机回归模型(SVR)等。研究者多基于气象因素与疾病的关联性建立预测模型,但气象因素间可能存在强相关,气象因素对疾病发病也可能存在交互作用。使用传统统计模型时,若自变量纳入过多或不全面,很可能会损失部分信息,造成预测精度下降。SVR、神经网络类模型虽然在预测精度方面取得良好效果,但存在“黑箱”问题。近年来,增强回归树模型(BRT)在机器学习竞赛中取得较好的成绩,其既能拟合自变量与因变量间的非线性关系,又能自动计算变量间的交互作用,模型的精度高,可解释性强。课题组前期的研究表明,在我国菌痢发病数最多的北京市,BRT的预测效果优于GAM和SARIMA。
我国使用国家传染病自动预警系统对传染病的发病进行预警,该预警系统的原理是将当前观察周期内某传染病的发病数与预先设定的预警阈值进行比较,超过阈值即发出预警信号。然而,该预警系统是在病例发生后进行预警,在时间上存在一定的迟滞性。菌痢的发病与气象因素间存在密切的联系,若能利用二者的关系,在疾病发生前发出预警信号,则更有助于当地卫生部门及时采取措施,控制疾病的流行。
研究目的
(1)了解2014-2016年华北地区菌痢流行病学规律,描述菌痢的三间分布;
(2)从时空角度分析气象因素与菌痢发病之间的关系;
(3)了解气象因素对菌痢发病风险的区域差异,探讨异质性来源;
(4)建立基于气象因素的预测预警模型,预测菌痢的发病趋势。
研究方法
华北地区34个城市2014年1月1日至2016年12月31日菌痢病例的个案资料来源于国家法定传染病信息系统,气象资料来源于中国气象共享服务网,人口、经济、卫生学资料来自于中国城市统计年鉴和各省(市)的统计年鉴。
应用描述性流行病学方法对研究期间华北地区菌痢疫情资料和气象资料进行特征描述和分析。采用Spearman相关探讨各气象因素之间的关联性。
在时间尺度上,应用地理探测器模型量化气象因素对菌痢发病的解释力。应用DLNM对气象因素分别建模,探讨各气象因素对菌痢发病的滞后效应。在空间尺度上,应用贝叶斯时空模型探测菌痢发病的空间热点区域。
在时空尺度上,分别建立贝叶斯时间独立模型、贝叶斯时空独立模型和贝叶斯时空交互模型,探讨气象因素对菌痢发病的影响。根据离差信息准则(DIC)选择相对最优模型。考虑到平均气温对菌痢发病可能存在拐点,在时空尺度上,仅计算暖季(5-9月)时平均气温与菌痢发病的关系。
应用DLNM定量评估华北地区各城市气象因素对菌痢发病的累积滞后效应。应用多变量Meta分析,合并华北地区气象因素对菌痢发病的总效应,应用Meta回归探讨气象因素对菌痢发病的异质性来源。
利用2014-2015年菌痢发病资料和气象资料,拟合BRT模型,并对2016年菌痢发病趋势进行预测,使用测试集的均方根误差(RMSE)、平均绝对误差(MAE)和相关系数的平方(R2)评价预测效果。建立基于气象因素的菌痢预警模型,预警阈值分别定义为历史发病数的P75、P80、P85、P90和P95。使用测试集的灵敏度、特异度和约登指数评价预警效果,使用信号强度指数评估预警信号的强度。
研究结果
(1)2014-2016年华北地区共报告菌痢病例101584例,5-10月为菌痢的高发月份。病例构成上,男性多于女性;0-4岁年龄组最多;农民发病数较多。地区分布上,北京市与天津市发病率最高。
(2)华北地区菌痢的发病具有一定的空间聚集性,北京市、天津市、廊坊市、阳泉市、太原市、长治市、邯郸市和新乡市为菌痢发病的热点区。
(3)平均气温是影响菌痢发病的主要气象因素。平均气温与菌痢的发病存在滞后效应,最佳滞后期为第3天。平均气温与菌痢发病的累积暴露反应关系呈“J”形曲线,当气温高于中位数时,气温每上升1℃,滞后0-7天,菌痢累积发病数增加2.42%(95%CI:1.13%-3.73%)。
(4)相对湿度与菌痢发病呈线性正相关,最佳滞后期为第0天。湿度每增加1%,滞后0-7天时,菌痢累积发病风险增加0.37%(95%CI:0.21%-0.52%)。
(5)温暖季节(5-9月),DLNM的结果显示,滞后3天时,气温每升高1℃,菌痢的发病数增加1.09%(95%CI:0.68%-1.50%)。贝叶斯时空模型的结果显示,滞后3天时,气温每升高1℃,菌痢的发病风险增加1.44%(95%CI:0.62%-2.27%)。
(6)高纬度、高经度、人口自然增长率高的地区平均气温对菌痢的发病风险更大。城镇化水平高以及医院数多的地区,气温对菌痢的发病风险更小。
(7)预测模型测试集的RMSE、MAE和R2分别为29.01-35.14、22.11-26.76和0.91-0.93。预警模型测试集的灵敏度均为1,特异度为0.85-0.98,约登指数为0.85-0.98。当预警阈值为P80和P95时,测试集的约登指数最大,达0.98,此时预警发病数分别为320例和382例。
研究结论
(1)平均气温是影响菌痢发病的主要气象因素。高温和高湿会增加菌痢的发病风险。
(2)高纬度、高经度、人口自然增长率高、城镇化水平低以及医院数少的地区可能是菌痢发病的脆弱性地区。
(3)在理想情况下,基于气象因素和历史发病资料预测菌痢效果良好。
已有研究显示气象因素可以通过影响病原体的繁殖能力和生存时间、改变传播媒介的地理分布范围以及改变人群对疾病的易感性等方式影响传染性疾病的传播规律和流行特征。据估计,2016年在全球范围内约有212438人因感染菌痢而死亡,30%的死亡发生在5岁以下儿童。我国菌痢发病数仍处于较高水平,其发病数呈现季节性升高的特点,提示菌痢的发病可能与气象因素有关。
菌痢同其他传染病相似,存在空间聚集性。但目前的研究多采用多元回归分析、分布滞后非线性模型(DLNM)等方法从时间尺度量化气象因素与菌痢发病的关系,鲜有在考虑菌痢发病空间自相关性特点的基础上,研究气象因素对菌痢发病的效应。此外,现有气象因素与菌痢发病关系的研究结果并不一致。气象因素对菌痢发病的效应具有地域性分异,但相关研究对二者间可能存在异质性来源未作深入探讨。
当前传染病预测领域常用的统计模型有季节自回归移动平均模型(SARIMA)、广义相加模型(GAM)、回归树、支持向量机回归模型(SVR)等。研究者多基于气象因素与疾病的关联性建立预测模型,但气象因素间可能存在强相关,气象因素对疾病发病也可能存在交互作用。使用传统统计模型时,若自变量纳入过多或不全面,很可能会损失部分信息,造成预测精度下降。SVR、神经网络类模型虽然在预测精度方面取得良好效果,但存在“黑箱”问题。近年来,增强回归树模型(BRT)在机器学习竞赛中取得较好的成绩,其既能拟合自变量与因变量间的非线性关系,又能自动计算变量间的交互作用,模型的精度高,可解释性强。课题组前期的研究表明,在我国菌痢发病数最多的北京市,BRT的预测效果优于GAM和SARIMA。
我国使用国家传染病自动预警系统对传染病的发病进行预警,该预警系统的原理是将当前观察周期内某传染病的发病数与预先设定的预警阈值进行比较,超过阈值即发出预警信号。然而,该预警系统是在病例发生后进行预警,在时间上存在一定的迟滞性。菌痢的发病与气象因素间存在密切的联系,若能利用二者的关系,在疾病发生前发出预警信号,则更有助于当地卫生部门及时采取措施,控制疾病的流行。
研究目的
(1)了解2014-2016年华北地区菌痢流行病学规律,描述菌痢的三间分布;
(2)从时空角度分析气象因素与菌痢发病之间的关系;
(3)了解气象因素对菌痢发病风险的区域差异,探讨异质性来源;
(4)建立基于气象因素的预测预警模型,预测菌痢的发病趋势。
研究方法
华北地区34个城市2014年1月1日至2016年12月31日菌痢病例的个案资料来源于国家法定传染病信息系统,气象资料来源于中国气象共享服务网,人口、经济、卫生学资料来自于中国城市统计年鉴和各省(市)的统计年鉴。
应用描述性流行病学方法对研究期间华北地区菌痢疫情资料和气象资料进行特征描述和分析。采用Spearman相关探讨各气象因素之间的关联性。
在时间尺度上,应用地理探测器模型量化气象因素对菌痢发病的解释力。应用DLNM对气象因素分别建模,探讨各气象因素对菌痢发病的滞后效应。在空间尺度上,应用贝叶斯时空模型探测菌痢发病的空间热点区域。
在时空尺度上,分别建立贝叶斯时间独立模型、贝叶斯时空独立模型和贝叶斯时空交互模型,探讨气象因素对菌痢发病的影响。根据离差信息准则(DIC)选择相对最优模型。考虑到平均气温对菌痢发病可能存在拐点,在时空尺度上,仅计算暖季(5-9月)时平均气温与菌痢发病的关系。
应用DLNM定量评估华北地区各城市气象因素对菌痢发病的累积滞后效应。应用多变量Meta分析,合并华北地区气象因素对菌痢发病的总效应,应用Meta回归探讨气象因素对菌痢发病的异质性来源。
利用2014-2015年菌痢发病资料和气象资料,拟合BRT模型,并对2016年菌痢发病趋势进行预测,使用测试集的均方根误差(RMSE)、平均绝对误差(MAE)和相关系数的平方(R2)评价预测效果。建立基于气象因素的菌痢预警模型,预警阈值分别定义为历史发病数的P75、P80、P85、P90和P95。使用测试集的灵敏度、特异度和约登指数评价预警效果,使用信号强度指数评估预警信号的强度。
研究结果
(1)2014-2016年华北地区共报告菌痢病例101584例,5-10月为菌痢的高发月份。病例构成上,男性多于女性;0-4岁年龄组最多;农民发病数较多。地区分布上,北京市与天津市发病率最高。
(2)华北地区菌痢的发病具有一定的空间聚集性,北京市、天津市、廊坊市、阳泉市、太原市、长治市、邯郸市和新乡市为菌痢发病的热点区。
(3)平均气温是影响菌痢发病的主要气象因素。平均气温与菌痢的发病存在滞后效应,最佳滞后期为第3天。平均气温与菌痢发病的累积暴露反应关系呈“J”形曲线,当气温高于中位数时,气温每上升1℃,滞后0-7天,菌痢累积发病数增加2.42%(95%CI:1.13%-3.73%)。
(4)相对湿度与菌痢发病呈线性正相关,最佳滞后期为第0天。湿度每增加1%,滞后0-7天时,菌痢累积发病风险增加0.37%(95%CI:0.21%-0.52%)。
(5)温暖季节(5-9月),DLNM的结果显示,滞后3天时,气温每升高1℃,菌痢的发病数增加1.09%(95%CI:0.68%-1.50%)。贝叶斯时空模型的结果显示,滞后3天时,气温每升高1℃,菌痢的发病风险增加1.44%(95%CI:0.62%-2.27%)。
(6)高纬度、高经度、人口自然增长率高的地区平均气温对菌痢的发病风险更大。城镇化水平高以及医院数多的地区,气温对菌痢的发病风险更小。
(7)预测模型测试集的RMSE、MAE和R2分别为29.01-35.14、22.11-26.76和0.91-0.93。预警模型测试集的灵敏度均为1,特异度为0.85-0.98,约登指数为0.85-0.98。当预警阈值为P80和P95时,测试集的约登指数最大,达0.98,此时预警发病数分别为320例和382例。
研究结论
(1)平均气温是影响菌痢发病的主要气象因素。高温和高湿会增加菌痢的发病风险。
(2)高纬度、高经度、人口自然增长率高、城镇化水平低以及医院数少的地区可能是菌痢发病的脆弱性地区。
(3)在理想情况下,基于气象因素和历史发病资料预测菌痢效果良好。