大型纵向监测健康管理队列设计及其统计分析策略研究

被引量 : 0次 | 上传用户:zhouyang340345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
健康管理(health management, HM)是对个体(包括健康个体、亚健康个体和病人)或群体(包括健康人群、亚健康人群、疾病人群)的健康危险因素进行全面监测、分析、评估、预测,旨在提供健康咨询和指导以及对健康危险因素进行干预的全过程。广义的健康管理还涵盖了疾病管理,即对个人处于疾病的低危险状态→进入疾病危险状态→发生早期病理改变阶段的管理通常称为健康管理,而对其出现临床症状→疾病→不同转归预后阶段的管理则称为疾病管理。尽管健康管理的概念还尚未完善,健康管理学的学科内涵、理论与技术方法还很不成熟,但社会公众对健康管理的渴求,已经使健康管理学研究成为国家和政府必须关注的、重点支持和优先发展的领域。健康管理概念的提出、健康管理学独立学科的发展趋势,以及我国健康管理的兴起和对健康管理行业的巨大需求,迫切需要对健康管理学的理论、方法和策略进行深入研究。其中,基于健康体检系统的“大型多中心纵向监测健康管理队列”是推动健康管理理论方法创新研究及其推广转化的重要数据管理平台。此种队列的建设,不仅是进行个人健康信息收集与健康档案管理、个体健康风险评估与人群分类、个体和群体健康干预及其健康改善效果评价的健康管理平台,而且是阐明疾病发生、发展与转归的研究平台。为此,本课题组自2004年就在山东省启动了“大型多中心纵向监测健康管理队列”,作者自2007年作为项目组的核心成员,参与了整个队列建设的数据采集、管理和数据库构建、队列随访等一系列工作,本文体现了本人所负责完成的队列建设研究经历。本文从多中心大型纵向监测健康管理队列构建、数据整合平台构建(数据清理、集成、变换等预处理)、数据填补及数据分析(广义估计方程及混合效应模型分析,Cox回归分析和Joint模型分析,各回归方法模拟比较)等几个方面进行了系统研究,并以尿酸对代谢综合征的影响研究为例进一步说明其应用性,旨在建立大型纵向监测健康管理队列及其统计分析策略。研究结果如下:1.构建“多中心纵向监测健康管理队列数据管理系统”,通过完善相应的数据字典和疾病字典、管理赋值规则、导入原始数据、查询导出处理后数据,将多中心纵向监测健康管理队列的原始数据转换成可利用统计软件直接进行分析的数据格式。2.利用SAS软件的mi过程或R软件的Amelia Ⅱ程序包,将缺失数据进行了有效的填补和相应的诊断。3.在调整了各项混杂后,广义估计方程、混合效应模型、Cox回归和Joint模型均证实血尿酸水平与代谢综合征的关联性有统计学意义,与正常血尿酸水平人群相比,高血尿酸人群患代谢综合征的风险是分别是1.449(95%CI:1.215,1.727),1.527(95%CI:1.187,1.965)、1.496(95%CI:1.287,1.740)和1.3735(95%CI:1.1565,1.6313)倍,提示四种模型均可用于大型纵向监测健康管理队列数据的统计分析。4.基于实际纵向监测健康管理数据,以Joint模型产生模拟数据,比较了广义估计方程、混合效应模型分析、Cox回归分析和Joint模型四种回归分析模型的第一类错误概率、检验效能和偏回归系数估计偏性。H0成立时,在0.05的检验水准下,四种方法的第一类错误概率均接近0.05,其中广义估计方程和Cox回归能较好地在0.05附近波动,而混合效应模型和Joint模型则稍稍高于0.05水平。H0不成立时,随样本含量的增大和偏回归系数的增大,广义估计方程、混合效应模型、Cox回归和Joint模型的检验效能单调递增,逐渐接近并达到100%,四种方法的检验效能的变化程度和变化趋势相似,但广义估计方程和混合效应模型始终略高于Cox回归和Joint模型。在比较估计偏性的方面,混合效应模型的估计最小,其次依次是广义估计方程、Cox回归和Joint模型。结论:1.运用这一纵向监测健康管理队列设计及其统计分析策略,可以解决纵向监测健康管理队列设计和数据综合分析利用的问题,将健康管理从采集健康信息的初始阶段,延伸至现状评估、疾病预测、健康促进与干预管理的深层阶段。2.“多中心纵向监测健康管理队列数据管理系统”可以将多个中心健康体检数据整合到统一的数据管理平台中,软件界面亲和、友好,易于操作,为进一步的填补和回归分析奠定了基础。3.对缺失数据的填补:基于MCMC算法的mi过程是较为经典和使用普遍的方法,而基于EMB算法的Amelia Ⅱ过程,可以方便的利用AmeliaView的视窗进行简便的数据导入、填补、导出、诊断,并可以填补横截面数据、时间序列数据和时间序列-横截面数据(可看作纵向数据)等多种类型的数据。4.统计模拟表明,对于大型纵向监测健康管理队列数据回归方法的选择:①由于样本含量足够大,一般情况下,可采用常规的广义估计方程来估计变量之间的关联性。②对于多中心(多水平)的纵向监测健康管理队列数据的回归分析,应利用混合效应模型进行建模分析。③一般情况下,上述两种回归分析模型皆可取得满意的效果。④理论方法更为复杂的Joint模型在分析此类大样本纵向监测健康管理队列数据时,并未显示出其优越性,但它可以计算个体特定时间点的发病风险和生存概率,特别适用于疾病的风险评估和风险预警。⑤对于此类纵向监测健康管理队列数据,若简单地利用Cox回归模型进行分析,其回归系数估计偏性较大。5.实例分析证明高血尿酸水平可增加代谢综合征的发病风险。创新点:1.提出了大型纵向监测健康管理队列设计及其统计分析策略的整体思路框架。2.自主研发的“多中心纵向监测健康管理队列数据管理系统”可以有效地对各中心体检数据整合、集成、变换、清理。3.在纵向监测健康管理队列数据中,对广义估计模型、混合效应模型、Cox回归和Joint模型进行了模拟评价,并提出了相应的回归分析策略。不足之处:在缺失值填补阶段,未纳入更多的填补方法和相应的诊断技术:对于给出的两种填补方法,未进行模拟试验评价其表现;在对广义估计模型、混合效应模型、Cox回归和Joint模型进行模拟评价时,未能从数理角度分析影响模型表现的关键因素。
其他文献
道教是中国土生土长的宗教,其中道教信仰的核心是神仙崇拜。本文通过论述道教神仙思想产生的根源,以及在道教文化中所孕育出的这种“神仙情结”,进一步论述神仙思想对明清时
<正>分享交流是区域活动非常重要的环节之一,它通过教师和幼儿共同的语言及非语言交流,汇集多种有益的信息,并分析、综合、提升,形成感性和理性的认识,从而逐步对幼儿产生影
本文以TiB2和LaB6两种典型硼化物为研究对象,研究其在铝熔体中的反应合成热力学条件及三维形貌演变生长机制,实现对两种粒子的生长控制和结构改性,为研发高效生核剂和金属基
自从98年全国高校扩招以来,每年高校应届毕业生的人数呈现快速增长的趋势,就山东省而言,2012年毕业的高校学生有大约30万人,如此大量的毕业生的档案、户口等其他信息的管理,
<正>整个20世纪的大多数时间.中国当代建筑在西方理论界中是处于“缺席”的地位.在西方林林总总关于世界现当代建筑史的著作中,偌大的中国始终隐遁无形。而同为西方建筑学追随
轨道交通站点区域协同发展是城市可持续发展的重要策略和趋势,能推进地区机能高效运作、实现地区催化作用、促使公交优先的紧凑发展模式、形成和保持经济的可持续性。文章在
深入推进工业化、信息化、城镇化和农业现代化(简称"四化")协调发展是推动新时代下中国经济社会转型的关键措施,作为这一新发展理念的重要组成部分,促进"以人为本"的信息化和
目的调查B群流行性脑脊髓膜炎(流脑)疫情的原因。方法于2018年2月22、27日对患者和密切接触者进行流行病学调查,并收集脑脊液、血液和咽拭子样品进行分离培养、PCR检测和二代
语言理解一直是认知科学研究的热点,但是其研究仅停留在句子层面上。近几十年来,语篇层次上阅读理解的推理研究受到了广泛的重视,成为研究的焦点。研究者采用实时、更为精细
上海自然博物馆设计体现了21世纪公共博览类建筑新的发展方向。文章从形态设计对自然元素的呼应,建筑空间与自然体验的融合,以及基于全寿命评价的绿色生态节能技术体系等方面