论文部分内容阅读
当前,医疗数据是各大医疗机构走向信息化的必要基础,然而随着各医院应用系统数据量的急剧扩大,新应用的不断出现以及应用之间的相互整合,各种应用每天都在不断地往数据库中添加信息,数据也以指数级的速度增加,数据的数量和复杂程度都是前所未有的。数据质量问题变得日益突出,这些问题主要表现在数据不正确、数据不完整、数据不一致等方面。质量低劣的数据不仅降低了医疗质量,可能引发医疗差错,而且已经成为影响医院管理者进行正确决策的重要因素,所以数据质量管理必将成为医疗行业信息化进程中一个必不可少的环节。电子病历是数字化医院的核心和基础,是数字化医院的诊疗活动的信息资源和操作平台。电子病历的信息来源于为其提供患者诊疗信息的各个子系统,如医师工作站、护士工作站、临床检验系统(LIS)、医学图像系统(PACS),以及其他临床信息系统(CIS)和医疗管理信息系统(HIS)。这些子系统将其有关患者的基本信息和诊疗信息提交给电子病历,从而形成患者的电子病历。电子病历中的数据是各个来自不同时期,不同硬件平台,不同操作系统的数据的集成。由于多种数据源中的数据里面会存在大量的“脏数据”,所以数据必须经过一定的处理,利用数据抽取工具,通过获得数据的特征和数据完整性分析,实现数据质量的控制。针对以上问题,本文做了一定的研究,工作和成果如下:1、研究并设计了一个具有灵活性的电子病历数据质量分析的ETL架构。该架构基于规则分级别的数据质量分析方法,构建针对电子病历系统的“数据质量指标集”和“质量分析规则库”,对源数据进行数据质量问题分析,通过缓冲区数据库、数据抽取过滤和数据质量分类控制功能,有效地提高数据质量分析的效率。2、开发并实现了一个电子病历数据质量分析系统。该系统可充分利用ETL架构的特点,可满足针对海量数据进行实时处理的性能要求。同时,通过对数据质量规则库的冗余消除和求精算法,有效地提高了系统的分析效率。3、建立面向电子病历数据质量分析的多维数据分析模型,并通过模型优化提高了系统的运行效率,实现了数据质量主题的多维OLAP的分析展示,通过进行各种OLAP操作,以多种方式展现数据的深层次细节质量问题。