基于随机森林方法预测焦虑障碍慢性化倾向的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:E200902027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的以广泛性焦虑障碍(generalized anxiety disorder,GAD)和惊恐障碍(panic disorder,PD)住院患者为研究对象,利用社会人口学、临床特征和生物学指标构建焦虑障碍数据库,基于随机森林(random forest,RF)方法来探索预测慢性化焦虑的临床及生物学标记,为临床的早期识别提供简单、可行的预测指标,为GAD和PD的个体化精准医疗提供参考。方法1.构建焦虑障碍数据库:回顾性收集2014年5月至2021年5月于郑州大学第一附属医院精神医学科就诊的1103例GAD或PD住院患者的临床资料,建立包括社会人口学资料、临床特征和生物学指标等方面的数据库。2.统计学分析:采用SPSS 26.0统计学软件进行一般数据分析,P<0.05表示差异有统计学意义。利用Python 3.7.6编程语言,基于均衡随机森林(RF)分类算法构建预测模型,采用循环10次的10-折交叉验证法评估模型拟合性能,并获取变量重要性排序,筛选最佳预测变量。结果1.焦虑慢性化患者的筛选根据入组标准和排除标准,共纳入1 121例患者,其病程分布特征为非正态分布,排除“1年<病程<2年”仅有的18例患者;将“病程≥2年”自定义为慢性组(简称GAD/PD-C组,共429例),“病程≤年”自定义为非慢性组(简称GAD/PD-NC组,共674例),最终共纳入1103例。2.两组的一般情况及临床资料比较比较429例GAD/PD-C组与674例GAD/PD-NC组的社会人口学及临床特征发现,性别、年龄、诊断亚型、首发年龄、诱因、个性倾向、系统药物治疗和精神疾病家族史差异具有统计学意义(P<0.05),其他特征差异无统计学意义(P>0.05)。比较GAD/PD-C组与GAD/PD-NC组的生物学指标发现,CRP、NLR、ACTH16 点、Cor16 点、TT4、FT4、PRL、E2、PROG、TESTO、Urea、T-CHO、TG、APOB、LDL和ACE水平差异具有统计学意义(P<0.05),其他指标差异无统计学意义(P>0.05)。3.RF模型的构建,计算变量重要性值将临床数据分为社会人口学、临床特征和生物学指标(包括炎症、内分泌和代谢水平)三个领域,仅纳入缺失值不超过30%的变量,使用多重插补法以获得完整数据集,最终共纳入50个预测变量。基于混合矩阵计算各领域的AUC值、准确度、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV),并根据AUC值来衡量预测模型性能。首先,将诊断亚型(GAD和PD)作为其中一个预测变量,对于焦虑障碍慢性化(GAD/PD-C)的RF预测模型,通过其变量重要性排序发现,除了首发年龄、年龄外,几乎所有的临床变量贡献度都低于生物学变量。本研究还发现,临床特征领域AUC值优于生物学领域,而社会人口学特征领域的AUC值最低,综合模型的AUC值(0.65)优于任何领域,准确度为65%,灵敏度为63%,特异度为 66%,PPV 为 0.55,NPV 为 0.74。进一步地,对诊断亚型GAD和PD分别分析。对于广泛性焦虑障碍慢性化(GAD-C)的RF预测模型,通过其变量重要性排序发现,首发年龄对模型的贡献最大。本研究还发现,在GAD-C中,临床特征领域AUC值略优于生物学领域,综合模型的AUC值(0.65)优于任何领域,准确度为65%,灵敏度为65%,特异度为 66%,PPV 为 0.58,NPV 为 0.73。对于惊恐障碍慢性化(PD-C)的RF预测模型,通过其变量重要性排序发现,FT4水平对模型的贡献最大。本研究还发现,在PD-C中,生物学领域的炎症水平和代谢水平的AUC值略占优势,其次是临床特征领域,而综合模型的AUC值仅为0.57,准确度为57%,灵敏度为57%,特异度为57%,PPV为0.41,NPV为 0.72。4.RF模型的优化,筛选最佳预测变量尽管涉及多种变量,GAD/PD-C初步的综合模型预测准确度仅为65%。本研究根据变量重要性排序尝试逐步排除不重要的变量,以优化模型。结果显示,在GAD/PD-C预测模型中,逐步排除不重要变量至含有前12个预测变量(依次为首发年龄、年龄、FT4、TESTO、HCY、PRL、ACE、UA、TSH、PLT、PROG、NLR)时,即开始显示较好的预测价值,AUC值为0.72(>0.70),此时的准确度为72%,灵敏度为68%,特异度为75%(均>60%);其中含有前2个预测变量(即首发年龄和年龄)时,RF优化模型的预测价值最高,AUC值0.97,准确度为97%,灵敏度为97%,特异度为97%,PPV为0.95,NPV为0.98。在GAD-C预测模型中,逐步排除不重要变量至含有前14个预测变量(依次为首发年龄、年龄、PRL、HCY、FT4、TESTO、CRP、LH、ACE、Urea、NLR、UA、TSH、PROG)时,即开始显示较好的预测价值,AUC值为0.71(>0.70),此时的准确度为71%,灵敏度为70%,特异度为72%(均>60%);其中含有前2个预测变量(即首发年龄和年龄)时,RF优化模型的预测价值最高,AUC值为0.96,准确度为96%,灵敏度为94%,特异度为97%,PPV为0.96,NPV 为 0.96。在PD-C预测模型中,比较优化后的PD-C相关RF模型参数未发现较好的预测模型,相对而言,逐步排除不重要变量至含有前1 1个预测变量(依次为FT4、SOD-1、TESYO、CREA、Mono、首发年龄、PLT、TG、CRP、ACE、UA)时,RF优化模型的AUC值最高仅为0.61,准确度为62%,灵敏度为57%,特异度为 64%。结论1.首发年龄较早、年龄偏大可能是GAD或PD慢性化的重要预测因素。2.生物学因素的纳入在一定程度上提高了综合模型的预测准确度,提示免疫内分泌紊乱和代谢失调可能影响GAD或PD慢性化轨迹;其中,甲状腺激素偏低可能对GAD或PD慢性化的预测更敏感。3.与GAD相比,PD慢性化预测模型的预测价值较低,提示PD慢性化机制可能更为复杂、多因。
其他文献
背景皮肤病学领域中开发的大多数人工智能(Artificial intelligence,AI)算法仅用于分类两种或多种皮肤肿瘤,有关识别包括肿瘤、炎症和感染性皮肤病等广泛疾病谱的AI算法的文献有限。此研究测试的这种分类多种疾病的人工智能算法能够识别44种常见皮肤病。目的测试一种分类多种常见皮肤病AI算法的诊断准确性,评估其诊断皮肤病的价值。方法于2021年2月至2021年8月在郑州大学第一附属医院
学位
小电流接地配电网系统发生单相接地故障时具有故障特征微弱的固有缺陷,同时故障特征还要受到高阻接地、三相不对称和噪声等外界因素的干扰,使得配电网单相接地故障定位存在准确率不足的问题。为提高多重干扰下的配电网故障定位准确率,文中提出一种基于广义S变换和TT变换融合的新型故障定位方法。该方法利用广义S变换在低频域的优良时频分辨能力提取低频暂态能量,利用TT变换在高频域的优良时频分辨能力提取高频暂态能量;再
期刊
背景皮肌炎(dermatomyositis,DM)是一种导致皮肤、肌肉、肺部等多种器官损伤的系统性自身免疫性疾病,临床表现主要有眶周水肿性紫红斑、Gottron征、披肩征、皮肤溃疡、对称性肌力减退、肌痛等,本病首发症状不一,误诊率较高,部分合并间质性肺疾病(interstitial lung disease,ILD)、快速进展性间质性肺疾病(rapidly progressive intersti
学位
背景重性抑郁障碍(Major Depressive Disorder,MDD)是一组在临床上主要表现心境低落、精力不足以及愉快感下降的精神疾病。紧张、焦虑及躯体不适等都是MDD患者的常见症状。从MDD的临床表现、治疗预后以及其发生发展的病理机制来看,MDD可谓是一组复杂又常见的精神疾病。在一项研究中,Fawcett等发现MDD患者患有高比例的中度到重度担忧、精神以及躯体焦虑。MDD伴焦虑症状在临床
学位
谐振接地系统发生单相接地故障时,线路健全区段与故障区段的零序电压电流的伏安特性和零序功率方向存在差异。单相接地故障的影响因素多,且呈现随机性,采用单一接地故障特征量的区段定位方法准确率不高。为此,本文提出一种基于多暂态特征量聚类的接地故障区段免阈值定位方法。首先求取发生故障后线路各区段首半波暂态零序电压导数与暂态零序电流之间的伏安特性特征向量和零序功率特征向量,再对两特征量做归一化处理并融合得到综
期刊
背景根据ICD-11定义,游戏障碍(gaming disorder,GD)是指一种持续或反复地使用电子或视频游戏的行为模式,表现为游戏行为失控,游戏成为生活中优先行为,不顾不良后果继续游戏行为并持续较长时间。睡眠障碍是游戏障碍的一种常见合并症,可导致或加剧行为冲动和成瘾,过度游戏行为会影响睡眠时间导致白天嗜睡和睡眠障碍。据调查,大约45%的青少年被父母报告有至少一种睡眠问题,睡眠问题通常被认为是游
学位
背景成釉细胞瘤(Ameloblastoma,AB)是一种牙源性上皮性肿瘤,具有局部侵袭性特点。成釉细胞瘤的生长或复发会导致功能障碍和面部畸形,目前多采用手术治疗,但治疗后可能出现复发。近年来研究报告发现成釉细胞瘤的复发性基因突变,包括BRAF、RAS、FGFR2、SMO和其他突变。其中BRAF突变是在这些肿瘤中发现的最常见的突变之一。BRAF是一种编码称为B-raf的蛋白质的基因,大于90%的BR
学位
背景和目的自身免疫性脑炎(autoimmune encephalitis,AE)泛指一类由自身免疫机制介导的脑炎。与AE相关的抗神经细胞抗体主要包括抗细胞内抗原抗体和抗细胞表面抗原抗体,目前已发现的抗体已达20余种。虽然抗体种类繁多,不同抗体类型导致的脑炎症状各异,但大多AE常以急性或亚急性起病,主要表现为精神行为异常、癫痫发作、认知障碍、意识水平下降等症状。由于一些患者发病初期精神症状明显,很容
学位
为解决配电网中辐射型线路的单相接地故障区段定位问题,对中性点经消弧线圈串/并联电阻接地电网中零序有功功率在非故障线路和故障线路区段的分布特点进行了分析,并给出了相应的表达式。在此基础上,提出了使用零序有功功率在辐射型配电网中定位单相接地故障所在线路区段的方法,并结合分析结果给出基于零序有功功率变化量的判据。该方法有明确的选择性,可在结构复杂的多分支、多段线路且没有装设自动调谐消弧线圈的配电网中进行
期刊
研究背景与目的斑秃(alopecia areata,AA)是皮肤科门诊常见的以毛囊为靶器官的慢性炎症性疾病,一般无自觉症状且患处皮肤正常。斑秃不仅影响一个人的外貌,往往也给患者的心理带来很大的负面影响。目前普遍认为AA是在一定的遗传背景基础上,外界环境的诱发下引起的一种由T淋巴细胞介导的自身免疫性疾病,涉及毛囊免疫豁免权的崩溃、细胞毒性免疫细胞识别毛囊相关自身抗原并产生免疫应答等多种因素,多种细胞
学位