论文部分内容阅读
煤炭是我国的重要能源,煤炭企业综合统计是国家综合统计的基础之一,是国家能源统计的重要组成部分。同时也是煤炭行业最重要的管理业务,是其一切业务活动的协调、指导与控制的依据。而目前我国煤炭企业使用的现有系统,有一定的局限性,功能不完备,稳定性差,不能对数据进行深层次处理,更没有决策功能,已经直接影响到煤炭企业快速决策、科学决策和管理水平的提高。因此,研究开发决策型的煤炭企业综合统计系统不仅具有重要的理论意义,也具有重要的现实意义。针对现有煤炭综合统计系统存在的不足,本课题引入数据挖掘技术,开发了三层煤炭综合统计系统,在传统系统的基础上增加数据挖掘层。通过深入比较了决策树法、神经网络法、贝叶斯网络法和粗糙集等多种数据挖掘算法,提出了一种基于决策树和粗糙集相结合的多变量决策算法。在建立决策树之前,采用粗糙集理论的决策表约简进行属性约简,约简后的属性集合,一是保持分类质量不变,二是属性集合中不含冗余属性。将约简后得到的条件属性集用于构造决策树,这样有利于减小待建决策树的规模。在建立决策树过程中,约简后的多个条件属性,利用距离函数及两个等价关系相对泛化的概念解决了多变量检验的问题,从而得到规模更小、精度更高的决策树。运用该算法构建了煤炭企业矿山效益决策模型,实现了对矿山效益的综合评价。根据评价结果,发现影响矿山效益的主要因素,进而提出提高矿山效益相应改进措施。该系统的建立,为企业决策和生产经营快速提供数据支持,从而提高煤炭企业管理水平,进而提升煤炭企业竞争力。