论文部分内容阅读
目的探索根据信息化数据源构建环境与健康大数据研究队列的新路径。方法以覆盖区域人口生命全周期的人口健康大数据平台为基础,采用自动采集和人工收集相结合的方法完善数据平台信息,从中获取环境与健康相关所有的目标变量信息,进行冗余数据清洗并筛选出主要变量,进行变量的标准化,之后以个人为单位进行数据链接构建新的人群队列,结合个人住址地理位置信息,匹配其环境及气象因素等信息,进行数据整合,建立新的环境健康队列数据库,进行环境因素对居民健康影响的总体分析。结果构建了"环境-气象-健康"大数据队列(CNMAPS,cohort ofningbo morbidity and mortality air pollution study),CNMAPS内包括2009至2017年共9年的环境、气象及健康资料。环境数据包括PM10、PM2.5、SO2、NO2、O3、CO等大气污染物社区尺度的浓度,同时包括区域绿地、步道、公园等健康支持性环境数据等;气象数据包括气温、湿度、风速等;健康数据包括区域人口生命周期全过程资料,主要是以个人为单位的疾病就诊医疗数据、检验检查数据、健康结局数据以及居民健康档案,数据规模为覆盖区域全人口(约1200万人),包含变量超100个,数据更新频率为每天。基于CNMAPS数据,课题组拟开展环境因素包括空气污染等对全死因疾病负担及心梗、COPD、脑卒中等疾病影响研究,以及气候变化对健康影响的风险评估。结论区别于传统的研究队列建立方法,依托信息化居民健康信息平台建立的CNMAPS队列,覆盖区域内的全人口,无需抽样,相对于传统队列建立人力物力财力资源需求相对少,可行性好;数据库信息来源于自然就诊记录及日常监测,数据可靠;数据库可以根据需要从信息平台进行变量清洗增减,数据结构灵活;队列的分析利用更侧重变量的宏观整合,无需特定调查,工作量小;这种队列的建立方法是信息化发展趋势下环境研究队列建立的一种新方向与新思路。