论文部分内容阅读
研究目的以高血压病患者为主要观察对象,采集脉诊客观参数及其他信息数据,利用XGboost算法构建肝火亢盛证在高血压病人群中的诊断评估模型,并探索肝火亢盛证在全样本中的特征变量及预测准确性,从一定程度上解决高血压病肝火亢盛证诊断与评价的关键科学问题。研究方法1、患者相关信息的收集根据课题研究目的及内容,结合目前已有的高血压病相关因素,制定本研究,的病例观察表,通过病例观察表收集患者的相关信息。病例观察表包括以下内容:患者知情同意书、个人一般信息、一般体格检查、中医症状、高血压病相关因素、生活方式相关因素。2、脉诊客观化参数信息的采集采用“DS01-A型”脉诊仪对研究对象进行手臂桡动脉双侧关脉客观化参数信息的采集,包括脉诊频域指标、时域指标等。由培训合格后的专人负责该仪器的使用,并严格遵照仪器操作规范及流程,以及脉诊参数信息采集过程中的注意事项,保证信息采集的可靠性和稳定性。3、高血压病肝火亢盛证诊断预测模型的构建将采集的信息录入数据库,首先对高血压病人群中肝火亢盛证与非肝火亢盛证的组间信息进行统计描述,筛选变量,然后利用XGboost算法构建基于脉诊客观化参数及其他相关变量的肝火亢盛证诊断预测模型。同时,为验证模型的准确性及进一步观察肝火亢盛证与脉诊客观化参数及相关变量之间的关系,探索了肝火亢盛证在全样本中诊断预测模型的构建。研究结果1、本研究共纳入研究对象520例。其中高血压病人群262例,包括肝火亢盛证131例,非肝火亢盛证131例。全样本中将高血压病肝火亢盛证和非高血压病肝火亢盛证合为肝火亢盛证组(共268例),高血压病非肝火亢盛证和正常组作为非肝火亢盛证组(共252例)。2、从脉诊客观参数的组间比较来看,高血压病人群中非肝火亢盛证在左手的频域指标(h3)、时域指标(t]、t4、W1、W2)、其他指标(Ass、A),右手的频域指标(h4)、时域指标(t)、其他指标(Ass、Ad、A)方面均高于肝火亢盛证组。而在全样本中发现肝火亢盛证组的h2(右)、h1(左)、h2(左)均高于非肝火亢盛证组;肝火亢盛证组的h5/h1(右)、t1/t(右)、t4(左)、W1(左)、h3/h1(左)均低于非肝火亢盛证组。3、在一般信息方面,本研究发现高血压病人群中从事脑力工作者更容易出现肝火亢盛证;而在全样本中则发现,从事体力工作者更容易出现肝火亢盛证。在一般体格检查方面,高血压病人群中发现肝火亢盛证的腹围、WHR明显高于非肝火亢盛证,具有统计学意义;全样本中发现肝火亢盛证组的胸围明显高于非肝火亢盛证组,其临床意义有待进一步探究。双臂血压值方面,全样本中肝火亢盛证组的收缩压、脉压差均高于非肝火亢盛证组,具有明显统计学差异。从中医症状上看,全样本中肝火亢盛证组在头晕、头痛、急躁易怒、口干、溲黄、目赤上要比非肝火亢盛证组程度重。在治疗相关因素上,高血压病人群中肝火亢盛证组与非肝火亢盛证组在是否服用中药、血压是否波动两方面存在明显统计学差异(p<0.05),服用中药、血压存在波动的人群在肝火亢盛证组中所占比例较高。在生活方式相关因素上,研究发现高血压病人群中,肝火亢盛证组与非肝火亢盛证组在是否食盐减少、是否食油减少两方面存在明显统计学差异(p<0.05),结果显示食盐增加、食油减少更倾向于患有肝火亢盛证;而在全样本中发现,有意识的运动(运动方式为散步、运动频率增加)能减少肝火亢盛证的发生,同时发现改善生活习惯(包括减少饮酒、食盐减少、食油减少、食肉减少、增加粗粮)也能减少肝火亢盛证的发生。4、本研究通过XGboost算法首先构建了高血压病人群中肝火亢盛证的诊断预测模型,选取了 160个变量进行最终特征变量挑选,经过计算确定最优模型包含10个特征变量,按重要性降序排序分别为中度急躁易怒、t4(左)、t5/t4(左)、h4(右)、舒张压(右)、t1/t(左)、h4/h1(左)、t2(左)、h5/h1(左)、腹围。该模型对肝火亢盛证的预测率(Specificity)为76.47%,AUC值为0.70,具有较高的预测准确率。进一步分析发现脉诊的客观化参数对高血压病肝火亢盛证证候诊断的贡献率最大,且脉诊参数多为复合指标,因为复合指标能更好地反映脉图特征,所以相比单一指标更具临床意义。从不同部位的关脉信息对高血压病肝火亢盛证证候诊断的贡献来看,左手关脉的贡献率更大,这也与中医传统理论中寸口诊法的脏腑分配相一致,中医脉诊理论认为左关属肝。为了更加深入的探讨肝火亢盛证证候诊断的特征变量及预测准确性,也为了扩展诊断预测模型的适应人群范围,本研究探索了在全样本中构建肝火亢盛证的诊断预测模型,发现了包含15个特征变量的最优模型,分别为中度急躁易怒、收缩压(左)、轻度急躁易怒、t4(左)、是否食肉减少、是否食盐减少、WHR、t5/t4(左)、A(左)、是否食油减少、是否有意识运动疗法、t1/t(右)、Ad(左)、t5/t4(右)、是否有意识改善生活习惯。该模型对全样本中肝火亢盛证的预测率为76.92%,模型的AUC值为0.815,说明具有较好的预测准确率。其中脉诊指标对模型贡献率也较大,而且在两个模型的特征性变量中,中医症状“急躁易怒”、脉诊变量t4、t5/t4、t1/t四个指标存在重复,说明这些变量对肝火亢盛证的预测具有重要意义。同时也发现全样本的诊断预测模型增加了 5个生活方式的相关变量,说明生活方式在全样本中对肝火亢盛证的影响较大。5、本研究利用自编程序以可视化的瀑布图方式,更好的展示出了 XGboost模型中不同的特征变量对不同研究对象的作用和预测贡献率,便于后期研究中开展有针对性的预防和干预。研究结论1、该研究通过XGboost算法初步构建了高血压病肝火亢盛证的诊断预测模型,具有较高的准确性,得出的重要性变量符合临床实际,对进一步提升高血压病肝火亢盛证的诊断准确率有着重要的临床意义,从一定程度上解决了高血压病肝火亢盛证诊断客观化的关键科学问题。2、本研究结合脉诊客观化参数、一般信息、体格检查、中医症状及其他相关因素等信息进行综合分析,构建了高血压病肝火亢盛的诊断模型,具有可操作性,该探索性研究方法值得推广至其他中医证候诊断研究中。