论文部分内容阅读
职工基本医疗保障制度是我国社会保障制度的重要组成部分,关乎社会的稳定与发展。随着我国医疗体系的不断完善,医疗保险不断增员扩面,多层次、广覆盖的医疗保障制度正为国民提供更好的医疗资源和医疗服务。与此同时,伴随着全球信息化的进程,形成了海量的医疗数据,既包含了资金数据,也有就诊人信息、医疗机构信息、处方信息等相关数据信息,而这些相关信息未被全部利用。本文在介绍数据挖掘、数据挖掘审计概念及国内外研究现状的基础上,明确了研究职工基本医疗保险数据挖掘审计的目的与意义。通过C市职工基本医疗保险数据挖掘审计实例,利用SQL Server2008 R2及SPSS Modeler软件,将数据挖掘审计的具体环节一一展现;并在数据基本分析的基础上,利用CHAID决策树及K-Means聚类模型,深度提炼职工基本医疗保险数据中所蕴含的规律,总结出骗保人群特征;最终在大大降低审计风险、提高审计质量和效率的同时,提出了完善医疗数据、强化医疗机构管理、提升医疗服务的公平性、安全性等方面的审计建议,并得到了可重复用于职工基本医保审计的数据流和数据模型,总结出数据挖掘审计较传统审计模式的优势。本文的主要工作概括为以下几点:1.介绍医疗保险数据挖掘及数据挖掘审计的国内外研究现状,并指出研究的必要性。2.列举所采用的内部控制审计方法及数据审计方法。3.调查职工基本医疗保险现行的内部控制制度并绘制相关流程图。4.采集相关单位数据,利用SQL Server2008 R2软件导入,并使用结构化查询语句完成数据的清洗及整理,生成审计中间表。5.利用SPSS Modeler软件进行数据审核,同时依据审计目标绘制并运行相关数据流,并借助CHAID决策树及K-Means聚类模型进行数据分析,最终确定审计疑点,得出审计结论。6.综合评价与分析审计结果。