论文部分内容阅读
研究背景:老年多器官功能不全综合征(Multiple organ dysfunction syndrome in the elderly,MODSE)是指老年人在器官存在老化和罹患各种慢性疾病的基础上,器官机能减退处于功能不全的临界状态,由某种可能并不严重的诱因激发,在短时间内出现2个或2个以上器官序贯或同时发生功能不全或衰竭的临床综合征。其病死率极高,是导致老年重症患者死亡的主要原因之一。故早期诊断和预测转归并及时进行相关集束化综合治疗是降低其死亡率的重要途径。临床上,常用的器官功能不全的评分,如Marshall评分、序贯器官衰竭评分(Sequential Organ Failure Assessment,SOFA)、急性生理学与慢性健康状况评分系统Ⅱ(Acute Physiology and Chronic Health Evaluation,APACHE Ⅱ)评分,但这些评分主要适用于普通成年人,MODSE具有其不同于普通成年人发生的多器官功能不全综合征(Multiple Organ Dysfunction Syndrome,MODS)的特点,常用的器官功能不全的评分对病情严重程度的评价和转归的预测存在局限性。鉴于老年重症患者和ICU处置环境的复杂性以及各种变量的易变性,收录监测全方位、多维度的指标,电子病历(Electronic Health Records,EMR)的创建和发展为这方面研究创造了可能性。目的:1)针对MODSE人群,运用机器学习算法分析MODSE早期死亡相关风险因素;2)利用集成机器学习模型XGBoost等构建评估MODSE早期死亡风险的预测模型,更好地辅助临床决策和治疗。方法:1)利用公开的基于电子病历的大型数据库重症医学信息数据库MIMIC-Ⅲ(Medical Information Mart for Intensive Care),根据纳入排除标准纳入 MODSE患者16014人,其中院内死亡2360人(14.73%),根据预后将患者分为死亡组(2360人)和存活组(13654人),采集人口统计学信息、入ICU第一天的生命体征、临床干预措施、全身炎症反应综合征评分(SIRS)等122个特征,比较两组患者各指标差异,采用XGBoost模型算法进行死亡相关特征重要性排名;2)根据MODSE纳入标准,在MIMIC-Ⅲ数据库、eICU协作研究数据库和解放军总医院重症数据库中生成三个MODSE患者数据集。随机抽取80%作为训练集,剩余20%为测试集,将122个特征作为模型参数,采用集成机器学习模型:SVM(支持向量机模型),KNN(K近邻模型),RF(random forest随机森林模型),XGboost模型于训练集中建立预测模型,在测试集中用受试者工作特征曲线(ROC)评估模型对MODSE患者死亡风险的预测价值,并与临床现有模型如SOFA、APACHE-Ⅲ、MODS、SAPS等评分的性能进行对比;最后将性能最好的模型于三个数据库中进行交叉验证。结果:1)与存活组比较,死亡组患者GCS均值、年龄均值、心率最大值等升高,BMI、收缩压最小值等下降,差异均存在统计学意义(P<0.01)。XGBoost算法特征排名前10的指标为:呼吸频率、APTT、年龄、体温、BMI、收缩压、血小板、血糖、休克指数、白细胞计数;2)XGboost模型预测MODSE患者死亡的性能最好,AUC为0.853,敏感性为0.826,特异性为0.729,准确率为0.874,较其他机器学习模型及传统临床评分优异。交叉验证对比中,MIMIC-Ⅲ数据库构建的模型在解放军总医院重症数据库中验证效果最好,AUC为0.882。结论:与传统的评分相比,集成机器学习模型的预测性能更加优越,具有更强的普适性。