论文部分内容阅读
目的:随着计算机技术、数据存储技术、网络技术等的快速发展以及在医疗领域的应用,医院信息化建设不断深入,由此产生了海量的临床信息,其中,电子病历系统中的信息尤为丰富。与此同时,医疗系统普遍面临信息多、知识少的问题,如何利用先进的技术和手段挖掘隐藏在海量数据背后的信息、如何从这些数据中汲取经验从而提高临床诊疗水平是目前的研究热点。因此,本研究以糖尿病为切入点,利用关联规则法,将数据挖掘技术应用到医疗领域中,以期发现糖尿病及其并发症之间的关联关系,提高医生的临床诊疗水平和患者的疾病预防效率,也为今后其他疾病的研究提供参考。方法:本研究数据来自青岛市某医院的电子病历系统,共计9094条糖尿病患者住院诊疗记录,首先采用MySQL关系数据库技术对原始数据进行预处理,经过数据清洗、数据集成、离散化等操作确保待分析数据的有效性和完整性;然后采用Apriori关联算法,设置最小置信度和最小支持度,基于Xcode平台对上述数据进行关联分析,找出糖尿病及其并发症之间的关联关系。结果:通过Apriori关联分析,得到的频繁项集中,包括1-项集6个、2-项集9个、3-项集4个;通过限定最小支持度和最小置信度,最终得到13条糖尿病及其并发症的关联规则,其中,支持度大于20%的强关联规则共计5条。结论:根据本研究的关联分析可知,糖尿病与冠心病、高血压、脂肪肝、慢性动脉闭塞症、脂代谢异常等疾病具有强关联关系,通过对关联规则结果表中前项、后项的分析可以发现,糖尿病极易引发高血压、冠心病、脂代谢异常、脂肪肝,并且多种并发症之间也存在较为密切的关联关系。其中,“冠心病、脂肪肝、高血压、脂代谢异常”四个结论符合目前医学领域的研究成果,“慢性动脉闭塞症”是本研究新发现的糖尿病并发症。