基于XGboost算法的高血压病肝火亢盛证诊断预测模型研究

来源 :中国中医科学院 | 被引量 : 7次 | 上传用户:tuwei0164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究目的以高血压病患者为主要观察对象,采集脉诊客观参数及其他信息数据,利用XGboost算法构建肝火亢盛证在高血压病人群中的诊断评估模型,并探索肝火亢盛证在全样本中的特征变量及预测准确性,从一定程度上解决高血压病肝火亢盛证诊断与评价的关键科学问题。研究方法1、患者相关信息的收集根据课题研究目的及内容,结合目前已有的高血压病相关因素,制定本研究,的病例观察表,通过病例观察表收集患者的相关信息。病例观察表包括以下内容:患者知情同意书、个人一般信息、一般体格检查、中医症状、高血压病相关因素、生活方式相关因素。2、脉诊客观化参数信息的采集采用“DS01-A型”脉诊仪对研究对象进行手臂桡动脉双侧关脉客观化参数信息的采集,包括脉诊频域指标、时域指标等。由培训合格后的专人负责该仪器的使用,并严格遵照仪器操作规范及流程,以及脉诊参数信息采集过程中的注意事项,保证信息采集的可靠性和稳定性。3、高血压病肝火亢盛证诊断预测模型的构建将采集的信息录入数据库,首先对高血压病人群中肝火亢盛证与非肝火亢盛证的组间信息进行统计描述,筛选变量,然后利用XGboost算法构建基于脉诊客观化参数及其他相关变量的肝火亢盛证诊断预测模型。同时,为验证模型的准确性及进一步观察肝火亢盛证与脉诊客观化参数及相关变量之间的关系,探索了肝火亢盛证在全样本中诊断预测模型的构建。研究结果1、本研究共纳入研究对象520例。其中高血压病人群262例,包括肝火亢盛证131例,非肝火亢盛证131例。全样本中将高血压病肝火亢盛证和非高血压病肝火亢盛证合为肝火亢盛证组(共268例),高血压病非肝火亢盛证和正常组作为非肝火亢盛证组(共252例)。2、从脉诊客观参数的组间比较来看,高血压病人群中非肝火亢盛证在左手的频域指标(h3)、时域指标(t]、t4、W1、W2)、其他指标(Ass、A),右手的频域指标(h4)、时域指标(t)、其他指标(Ass、Ad、A)方面均高于肝火亢盛证组。而在全样本中发现肝火亢盛证组的h2(右)、h1(左)、h2(左)均高于非肝火亢盛证组;肝火亢盛证组的h5/h1(右)、t1/t(右)、t4(左)、W1(左)、h3/h1(左)均低于非肝火亢盛证组。3、在一般信息方面,本研究发现高血压病人群中从事脑力工作者更容易出现肝火亢盛证;而在全样本中则发现,从事体力工作者更容易出现肝火亢盛证。在一般体格检查方面,高血压病人群中发现肝火亢盛证的腹围、WHR明显高于非肝火亢盛证,具有统计学意义;全样本中发现肝火亢盛证组的胸围明显高于非肝火亢盛证组,其临床意义有待进一步探究。双臂血压值方面,全样本中肝火亢盛证组的收缩压、脉压差均高于非肝火亢盛证组,具有明显统计学差异。从中医症状上看,全样本中肝火亢盛证组在头晕、头痛、急躁易怒、口干、溲黄、目赤上要比非肝火亢盛证组程度重。在治疗相关因素上,高血压病人群中肝火亢盛证组与非肝火亢盛证组在是否服用中药、血压是否波动两方面存在明显统计学差异(p<0.05),服用中药、血压存在波动的人群在肝火亢盛证组中所占比例较高。在生活方式相关因素上,研究发现高血压病人群中,肝火亢盛证组与非肝火亢盛证组在是否食盐减少、是否食油减少两方面存在明显统计学差异(p<0.05),结果显示食盐增加、食油减少更倾向于患有肝火亢盛证;而在全样本中发现,有意识的运动(运动方式为散步、运动频率增加)能减少肝火亢盛证的发生,同时发现改善生活习惯(包括减少饮酒、食盐减少、食油减少、食肉减少、增加粗粮)也能减少肝火亢盛证的发生。4、本研究通过XGboost算法首先构建了高血压病人群中肝火亢盛证的诊断预测模型,选取了 160个变量进行最终特征变量挑选,经过计算确定最优模型包含10个特征变量,按重要性降序排序分别为中度急躁易怒、t4(左)、t5/t4(左)、h4(右)、舒张压(右)、t1/t(左)、h4/h1(左)、t2(左)、h5/h1(左)、腹围。该模型对肝火亢盛证的预测率(Specificity)为76.47%,AUC值为0.70,具有较高的预测准确率。进一步分析发现脉诊的客观化参数对高血压病肝火亢盛证证候诊断的贡献率最大,且脉诊参数多为复合指标,因为复合指标能更好地反映脉图特征,所以相比单一指标更具临床意义。从不同部位的关脉信息对高血压病肝火亢盛证证候诊断的贡献来看,左手关脉的贡献率更大,这也与中医传统理论中寸口诊法的脏腑分配相一致,中医脉诊理论认为左关属肝。为了更加深入的探讨肝火亢盛证证候诊断的特征变量及预测准确性,也为了扩展诊断预测模型的适应人群范围,本研究探索了在全样本中构建肝火亢盛证的诊断预测模型,发现了包含15个特征变量的最优模型,分别为中度急躁易怒、收缩压(左)、轻度急躁易怒、t4(左)、是否食肉减少、是否食盐减少、WHR、t5/t4(左)、A(左)、是否食油减少、是否有意识运动疗法、t1/t(右)、Ad(左)、t5/t4(右)、是否有意识改善生活习惯。该模型对全样本中肝火亢盛证的预测率为76.92%,模型的AUC值为0.815,说明具有较好的预测准确率。其中脉诊指标对模型贡献率也较大,而且在两个模型的特征性变量中,中医症状“急躁易怒”、脉诊变量t4、t5/t4、t1/t四个指标存在重复,说明这些变量对肝火亢盛证的预测具有重要意义。同时也发现全样本的诊断预测模型增加了 5个生活方式的相关变量,说明生活方式在全样本中对肝火亢盛证的影响较大。5、本研究利用自编程序以可视化的瀑布图方式,更好的展示出了 XGboost模型中不同的特征变量对不同研究对象的作用和预测贡献率,便于后期研究中开展有针对性的预防和干预。研究结论1、该研究通过XGboost算法初步构建了高血压病肝火亢盛证的诊断预测模型,具有较高的准确性,得出的重要性变量符合临床实际,对进一步提升高血压病肝火亢盛证的诊断准确率有着重要的临床意义,从一定程度上解决了高血压病肝火亢盛证诊断客观化的关键科学问题。2、本研究结合脉诊客观化参数、一般信息、体格检查、中医症状及其他相关因素等信息进行综合分析,构建了高血压病肝火亢盛的诊断模型,具有可操作性,该探索性研究方法值得推广至其他中医证候诊断研究中。
其他文献
二人台《花落花开》是呼和浩特民间歌舞剧团历经四年打造的大型二人台现代戏,其内容主要讲述的是发生在北方偏远山村的一个故事,剧情围绕一起蓄意车祸展开——高月清的丈夫长
随着社会主义市场经济体制和现代中小企业制度的确立,为了在市场竞争中求生存、求发展,在中小企业财务风险的控制上显得比以往任何时候都重要。经济社会的发展正经历着由工业
从空间认知的角度,将历史街区的人、地、房从物质空间层面上分为建筑、院落、地块(街坊)以及街巷四个层次,结合地理信息系统提出基于GIS历史街区保护设计新方法.
新媒体应用使少数民族文化传播主体由单一的主流媒体和专业文化传承人,拓展到普通民众;传播客体也由单一的少数民族专业传承人,外延到自媒体广大受众;传播媒介由传统纸质、固
摘要:弹性节奏,既是使音乐表演艺术魅力提升的很重要的一种手法,更是使合唱艺术魅力提升的很重要的一种手法!于是,弹性节奏运用的得当与否,便也成了判断与衡量一个指挥者优劣
研究目的:观察电针结合TDP治疗神经根型颈椎病的疗效及讨论作用机理。方法:以60例神经根型颈椎病患者为研究对象,采用随机分法为治疗组(电针结合TDP组)30例和对照组(电针组)30
模具寿命是直接影响产品质量、加工效率和成本的重要因素之一。而磨损是模具的最主要的失效形式,模具的磨损直接影响模具寿命,同时也会引起工件划痕、拉毛等缺陷,从而降低了产品
当今世界科学技术迅猛发展,人类已步入信息化时代,如何在新形势下取得战争的主动权和战争的胜利,正是我军新军事变革所要考虑的问题,而其中最关键的是新型高素质军事人才的培
一般条件下, ZnO半导体材料主要表现为n型导电特性,制约了ZnO基太阳能电池及光电器件应用开发,本论文利用具有较好的p型导电稳定性的Cu2O半导体材料与ZnO半导体结合,开展了ZnO/Cu
随着我国综合实力的不断增强,人们的生活质量有了很大程度的提高,开始享受生活,追求理想。音乐、美术、文化在这种形势下得到快速的发展。音乐能够缓解人们的生活压力,丰富人