基于机器学习模型辅助诊断非ST段抬高型心肌梗死的相关研究

来源 :新疆医科大学 | 被引量 : 1次 | 上传用户:soloviola
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:通过纳入胸痛中心非ST段抬高型心肌梗死(Non-ST segment elevation myocardial infarction NSTEMI)及不稳定性心绞痛(Unstable angina pectoris,UA)患者的临床临床数据建立数据库,对NSTEMI患者的初步诊断进行准确性评价,分别选用Logistic回归方案与机器学习算法构建NSTEMI诊断模型,通过模型性能的综合评价筛选最优模型以提升NSTEMI患者诊断的准确性。方法:第一部分:1)采用连续纳入方式录入2017年1月至2019年12月新疆医科大学第一附属医院及石河子大学医学院第一附属医院胸痛中心非ST段抬高急性冠脉综合征患者的临床数据并建立数据库;2)筛选胸痛中心数据库中于24小时内完成冠状动脉造影(Coronary angiography,CAG)的NSTE-ACS患者作为研究对象并建立实验数据集,以CAG诊断结果作为衡量标准,对实验数据集中NSTEMI患者初步诊断的准确性进行评价;3)采用非条件Logistic回归方案筛选实验数据集中的诊断特征变量,依据诊断特征变量的筛选结果构建Logistic回归诊断模型,利用诊断评价的相关指标对模型性能进行评估;第二部分:1)选用Python 3.6软件的函数包对NSTE-ACS患者的临床数据进行预处理,将数据转换为适合机器学习(Machine learning,ML)算法的数据格式;2)分别采用三种不同类型ML算法进行特征变量筛选,通过算法性能的比较选择最优算法完成诊断特征项筛选;3)依据分类权重及相关系数对筛选所得特征项进行重要性排序,并采用Shapely值描述各特征项的贡献值;4)基于特征项筛选结果建立用于ML模型构建的实验数据集,选用留出法按8:2比例将该数据集分割为训练集、验证集及测试集,利用训练集数据构建ML诊断模型,选择验证集数据对模型的一致性进行验证。第三部分:1)分别纳入指南推荐诊断特征项及ML算法筛选所得特征项构建ML诊断模型;2)基于相同测试集数据,利用模型评价指标对两种特征项纳入方式所构建模型的性能进行评估与比较;3)通过对本研究所构建不同类型ML模型综合性能的评估计与比较,进一步筛选最优模型以提升NSTEMI患者诊断的准确性。结果:第一部分:1)实验数据集共纳入1566例NSTEMI及UA患者,以CAG确诊为衡量标准,NSTEMI患者初步诊断的灵敏度为88.59%,特异度为89.44%,约登指数为0.79,Kappa值为0.78;ROC曲线的AUC值为0.821(95%CI,0.775-0.868);2)基于实验数据集完成特征筛选后所构建的Logistic回归诊断模型纳入的变量包括就诊前心绞痛次数、心电图ST段压低、TIMI评分、红细胞压积(Hematocrit,Hct)、肌酸激酶同工酶(Creatine kinase isoenzyme,CK-MB)、乳酸脱氢酶(lactate dehydrogenase,LDH)、B型利钠肽(B-type natriuretic peptide)以及肌钙蛋白T(Cardiac troponin T,c Tn T)(95%CI,OR=3.467,38.020,1.314,33.745,0.997,1.003,1.000,1.285);3)Logistic回归模型的诊断灵敏度为93.7%,特异度为94.21%,约登指数为873,Kappa值为0.84,ROC曲线的AUC值为0.924;第二部分:1)选用随机森林(Random forest,RF)、Select KBest以及极端梯度提升(Extreme gradient boosting,XGBoost)算法进行特征筛选的性能评价结果中,所用时间的平均值分别为2.09±0.14s、0.51±0.07s及1.85±0.08s;2)依据分类权重及相关系数对特征项的重要性进行排序,排名靠前的特征项分别为c Tn T、LDH、CK以及心电图ST段的改变(95%CI,0.21±0.15,0.11±0.06,0.08±0.005,0.06±0.007);特征变量的Shapely值与重要性排序之间具有一致性,热力图的结果分析表明排序靠前的特征项之间具有较强的关联性;3)依据特征筛选结果所建立的实验数据集共纳入了701条NSTEMI与UA患者数据,采用留出法以8:2比例对数据集进行分割,其中476条数据用于ML模型的训练与验证,225条数据用于测试;4)XGBoost、RF、梯度提升模型(Gradient boosting machine,GBM)、以及朴素贝叶斯(Naive Bayes,NB)算法的学习曲线与验证曲线之间具备较好的拟合。第三部分:1)相较于纳入指南推荐NSTEMI诊断特征项所构建的ML模型,通过ML算法筛选特征所建立的XGBoost、支持向量机、RF、GBM以及逻辑回归模型ROC曲线的AUC值均有所提升(95%CI,P=0.003,0.04,0.036,0.002,0.041);2)XGBoost模型的综合性能优于本研究所构建的其他ML模型,该模型在测试集数据中对NSTEMI及UA诊断的准确率、精确率、召回率及F1积分分别为(95%CI,0.95±0.014,0.94±0.0011,0.98±0.003,0.96±0.007);(95%CI,0.93±0.017,0.96±0.008,0.82±0.014,0.89±0.014),决定系数为0.72,ROC曲线的AUC值为0.97。结论:1)基于本研究所建立的实验数据集,相较于初步诊断评价的各项指标,纳入多特征项构建的Logistic回归诊断模型在NSTEMI诊断的灵敏度、特异度、一致性及准确性方面均有所提升;2)本研究选用的Select KBest算法在NSTEMI诊断特征项筛选中体现了良好的性能,筛选结果与Shapely值计算结果之间具有一致性;XGBoost、RF、NB以及GBM算法的学习曲线与验证曲线之间具有较好的拟合;3)相较于仅纳入指南推荐诊断特征项所建立的ML诊断模型,基于ML算法筛选特征所构建模型的体现出更优异的性能;4)XGBoost与GBM模型的决定系数、PR曲线中的AUC值均优于其他ML诊断模型,在以准确度、精确度、召回率以及F1积分等指标进行的模型评价结果中,XGBoost模型表现出较为均衡的性能。
其他文献
目的:头颈鳞状细胞癌(Head and neck squamous cell carcinomas,HNSCC)是世界上第六大常见的恶性肿瘤,预后较差,5年生存率仍然低于50%。长链非编码RNA(Long non-codingRNA,lncRNA)充当癌基因或抑癌基因在癌症的发生和发展中具有要作用。本研究旨在通过分析癌症基因图谱(The Cancer Genome Altas,TCGA)数据库中H
学位
随着人们对居住舒适性的要求,家用空调的噪声水平成为了用户购买空调的重要参考指标。作为空调的动力来源,压缩机是空调噪声的主要来源,但电机引起的噪声振动缺乏有效的分析手段。通过推导电机电磁力的成因,采用Maxwell计算分析工具,仿真分析了电机的电磁力密度,并通过压缩机噪声频谱验证了力密度改善的有效性,验证了所述振动噪声的分析方法的正确性,为空调压缩机的噪声分析和改善提供有效的仿真计算方法。
期刊
目的:环状RNA(CircularRNA,circRNA)是一种独特的闭合圆环结构的非编码RNA(Non-coding RNA,nc RNA),虽然已经证实许多人类疾病与circRNA有密不可分的联系,但circRNA是否对骨髓间充质干细胞(Bone Marrow Mesenchymal Stem Cells,BMMSCs)成骨分化过程具有潜在的调节功能有待进一步研究。本研究应用高通量测序技术(H
学位
目的:慢性牙周炎(chronic periodontitis,CP)是牙周组织的最常见的炎症性疾病,牙周支持组织因炎性病变而遭到破坏,是目前人牙齿缺失的重要原因之一。慢性牙周炎是环境因素和遗传因素等多因素共同作用下发生的疾病,遗传因素在慢性牙周炎的发病过程中起到了极其重要的作用。Toll样受体信号通路中的基因及其SNP与慢性牙周炎易感性之间的研究结果存在着不同程度的差异,有着不同的争议与矛盾。尤其
学位
目的:颞下颌关节骨关节炎(Temporomandibular Joint Osteoarthritis,TMJOA)是颌面部高发疾病,对患者的生活质量影响较为严重。颞下颌关节滑膜肿胀增厚,软骨损伤增加了疾病的难治性。焦亡是一种细胞炎症性损伤形式,NLRP3炎性小体的组装后释放炎性因子IL-1β,IL-18。MIF作为多效因子,参与炎症的发生发展,在此过程中活化的NF-κB通路最具有指向性,本研究旨
学位
蛋白核小球藻是十分重要和常见的可食性微藻,具有丰富的营养。然而,小球藻存在特殊的“藻腥味”,会直接或间接给食品带去不良风味,影响相关食品的可接受性。目前,人们对这种藻腥味的具体风味成分还不十分清楚。本研究以蛋白核小球藻为主要研究对象,首先通过电子鼻和顶空固相微萃取-气相色谱-质谱联用技术(HS-SPME-GC-MS)测定蛋白核小球藻及其他四种常见食(饲)用微藻的挥发性成分及其风味特征,确定蛋白核小
学位
目的:饲鸽者肺的发病机制、肺组织病理学特点等尚未完全明确,本研究通过分析饲鸽者肺患者的临床特点以提高对该病的认识,同时探讨不同病理时期动物模型的造模方法,并通过动物模型进行肺纤维化机制研究,为阻断过敏性肺炎炎症损伤和肺纤维化进展提供新靶点。方法:本研究主要从四个方面进行:(1)总结分析饲鸽者肺患者临床及实验室检查特点;(2)分析纤维化期患者外周血Breg细胞比例、α-SMA、TGF-β1及Notc
学位
研究目的:新疆是包虫病的流行和高发地区,严重威胁畜牧业生产和人民群众的身体健康。目前,外科手术和药物治疗均难以有效满足包虫病的临床治疗需要。放射治疗技术的发展,为包虫病的临床治疗提供了可行方案。本研究旨在从动物实验和临床研究两个方面探讨放射治疗在包虫病治疗方面的疗效和安全性,其目的如下:1)探讨放射线治疗绵羊肺包虫病的可行性和安全性。2)探讨放射线治疗后,绵羊肺包虫病灶组织内TGF-β1、MMP-
学位
目的:临床上化疗联合免疫治疗已经成为弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)的标准治疗方案。在免疫化疗过程中,T细胞免疫特征及免疫检查点的作用机制尚不完全明确。本研究旨在探讨DLBCL相关CD8+T细胞中程序性细胞死亡蛋白1(Programmed cell death protein 1,PD-1)和淋巴细胞激活基因3(Lymphocyte ac
学位
随着城市机动化进程的加快,城市交通拥堵问题日渐突出,在城市路段早晚高峰期间车辆变道是造成交通拥堵的一个关键问题。车辆随意变道或强制变道会恶化交通环境,造成目标车道后车产生减速或停车现象,严重时引发交通事故等风险。本文以快速路(西安市南二环快速路)高密度交通流(0.80≤V/C≤0.90)条件为研究背景,以车辆变道为研究内容,探讨了车辆变道过程及变道对目标车道后车造成的影响。首先,提取变道数据,采用
学位