论文部分内容阅读
随着医院信息化建设的不断深入,信息系统已覆盖了医院业务开展的各个部门,特别是病人的诊疗过程,从挂号登记到病历文书书写,从处方医嘱下达到病人费用结算,都以电子化形式存储在信息系统数据库中,积累了海量医疗信息,作为脑专科医院,对神经系统专科病种的电子病历(Electronic Medical Records)信息积累尤为丰富。近年来,电子病历信息的数据挖掘(Data Mining)已逐渐成为研究的热点,因此,积极探索科学实用的数据挖掘技术,在海量电子病历数据中发现有价值的规则,为临床专家在疾病诊治和临床科研提供科学依据,提升诊治水平,具有重大意义和广阔前景。本文在研究关联规则数据挖掘技术基础上,结合广东三九脑科医院的医院信息系统,开展基于关联规则的电子病历挖掘的应用研究。主要内容包括:1.对国内外数据挖掘技术在医疗领域应用现状进行分析,介绍了医院信息系统的体系结构和应用进展。针对电子病历数据分析,阐述了挖掘的方法和过程,以及需要注意的若干问题。2.介绍了关联规则数据挖掘的基本概念,分类和挖掘过程,并对主要关联规则算法Apriori和FP-growth算法进行了描述,应用举例。3.重点对Apriori算法的执行过程,实例说明,局限性和优化方法进行了描述;针对电子病历数据结构复杂,数据量大,数据更新速度快等特点,在挖掘频繁项集时,从减少扫描的数据量和减少对事务数据库扫描的方面考虑,采用改进的Apriori算法,并对改进算法进行了实际数据的实验分析,较之经典Apriori算法提高了数据挖掘效率。4.以广东三九脑科医院电子病历系统2011年度出院病历数据为例,分析了数据预处理的方法和操作过程,采用改进的Apriori算法分析了癫痫及相关疾病之间的规律,并对挖掘结果进行了评价说明。