论文部分内容阅读
目的:心脏康复效果评价常需要对研究对象进行随访监测,由于急性冠脉综合征患者的综合干预时间长,不同阶段采取的干预措施不尽相同,不同患者随访的时间与间隔存在差异,患者监测数据的影响因素较多,研究对象欠合作或由于其行动不便等原因,使得纵向监测数据获取过程中不免引致数据缺失。在可干预的心血管病危险因素中,超重和肥胖就是一个干预因素,体质指数(BMI=体重/身高2)就是评价干预效果的常用指标。在资料收集的过程中有可能会出现分子或分母指标的缺失,即比值缺失,亦称为不完全比值(Incomplete Ratio)。实际研究中对比值缺失数据进行填补,由于比值中蕴藏着一定的函数关系,给统计资料比值缺失数据的填补提出了新问题。方法:本课题主要针对急性冠脉综合征患者的体质指数BMI、血清钠尿肽BNP及肌钙蛋白c Tn I进行研究,采用多重填补的方法,将缺失数据填补成完整数据集并进行分析,探索比值缺失数据的填补方法及策略。通过对心脏康复二级预防综合干预缺失数据资料进行多重填补,尤其是评价体重管理的指标体质指数(BMI),若构成体质指数(BMI)的体重和身高2未同时缺失,在填补模型中直接采用监测到的体重和身高具有一定合理性。模拟证实常见的六种填补模型(M1~M6)进行比值缺失填补时的差别及影响填补的敏感因素;采用急性冠状动脉综合征患者早期CCU心脏康复二级预防综合干预监测数据进行实例分析,运用Stata13软件相应模块进行编程,实现比值协变量缺失数据的多重填补及填补后模型分析。结果:本课题主要对体重管理指标体质指数BMI进行多重填补,BMI=体重(kg)/身高2(m2)。通过六种常用填补模型的模拟研究,可知:1、当比值协变量分母的变异系数为10%时,决定系数R2=0.1时,采用填补模型M1~M6对比值协变量缺失数据进行填补,填补效果基本相近,但当缺失机制为完全随机缺失(MCAR)时,可产生负向偏差,模型M5和M6的负向偏差相对较大。2、当比值协变量分母的变异系数为20%时,决定系数R2=0.2时,采用填补模型M5进行填补,在缺失机制为完全随机缺失(MCAR)时,所产生的负向偏差为-0.610,其他填补模型M1~M4、M6的偏差分别为-0.01、-0.013、-0.011、-0.01及-0.058,与0值的偏离程度均明显小于模型M5;可知,填补模型的稳健性强烈依赖于比值协变量分母变异系数的大小,当分母变异系数较大时,模型M5填补的填补效果较差。3、随着比值协变量分母的变异系数逐渐增大,模型M6的填补效果明显优于模型M5。模型M6采用自然对数转换,不仅可使比值协变量的分子和分母服从正态分布,也能转换比值的运算关系,充分挖掘原始数据信息,提高填补方法的稳健型。本文结合急性冠动脉综合征CCU病房心脏康复二级预防综合干预实例进行分析,CV(身高2)=10.2%,填补模型M1~M6填补结果基本一致,均数间相差为(0.21~1.31)kg/m2,考虑到能否充分提取数据资料的信息,选择模型M6的填补结果,填补后体质指数BMI的平均水平为(24.75±7.16)kg/m2。对填补后的完整数据进行模型分析,结果表明,BMI、性别和肌钙蛋白c Tn I均可影响血清中钠尿肽BNP的浓度,均为正相关,其中肌钙蛋白c Tn I的标准化回归系数b¢=0.273,对血清中的钠尿肽BNP影响较大,BMI则影响较小。结论:本文针对医学研究中比值协变量缺失数据,采用模拟研究,探索了不完全比值协变量经数学转换后,在比值分母变异系数不同取值的情况下,常用填补模型M1~M6间的差别,比值分母变异系数的大小影响模型填补效果,对比值分子分母进行自然对数转换,不仅可提高原始资料信息的提取,而且也扩展了填补模型的适用范围;同时采用实例进行分析,实现了不完全比值协变量多重填补,并对填补后的完全数据集进行模型分析,为不完全比值协变量的多重填补提供方法学的参考。