论文部分内容阅读
随着社会信息化的飞速发展,国家卫生部就推进医疗卫生行业信息化建设作出专门的强调。本文则以省卫生厅的“区域医疗监管平台”课题为研究基础,针对医疗卫生行业的信息孤岛、信息协同共享及监管困难等难题,提出构建医疗卫生信息数据中心,并把所有医疗行业的数据同步到数据中心的设计思想来解决这些难题。在此过程中就需要解决医疗卫生数据中心的构建、异构关系数据库到数据中心的同步和数据中心效率问题就构成本文研究内容。通过深入的研究分析医疗卫生信息数据中心规模及相关需求问题。在对比和分析关系数据库与新型的NoSQL数据库的差异后提出运用NoSQL数据库来构建,通过分析几种NoSQL数据库特点确定以HBase构建医疗卫生信息数据中心。为确定数据模型,提出以关系数据库的E-R建模基础提出HBase的C-O-R建模思想,然后综合分析卫生部颁布医疗卫生元数据标准和部分医疗卫生机构的实际情况,实现医疗卫生信息的HBase数据中心构建。为实现把各医疗机构的异构关系数据库中的数据透明无差异的同步到数据中心,提出以下方案。首先,在数据格式上提出异构数据库产生的异构数据进行标准化的XML和JSON通用数据格式封装实现屏蔽异构数据库的数据差异;其次是传输协议简单及通用,采用SOA架构设计思想,提出运用Web Service方法实现数据同步传输;在异构数据库的增量数据获取方面揉合时间戳、触发器及日志法为一体的方法;最后,提出通用前置机设计实现对所有异构数据库的读取,实现采用XML文件对异构数据库的差异配置。在构建好HBase中心并拥有数据后,由于HBase对于数据访问只有Row Key的定位及全表扫描两种,为了提高复杂查找效率而提出HBase的列索引构建。本文提出两种索引设计方式:运用Row Key优势和构建索引表。本文索引表的构建是采用MySQL数据库与HBase数据库相结合的双索引体系结构。最后经过模拟测试分析,并同MySQL的相关测试性能进行对比,验证出本文的设计方法可以较好的完成医疗卫生信息中心的构建和异构数据库到数据中心的同步,实现医疗卫生数据共享、监管及业务协同。