数据挖掘在自学考试系统中考生流失分析的应用

被引量 : 8次 | 上传用户:tdran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球信息化的发展,信息大量的增加和堆积,人们就需要从大量信息数据中提取重要信息以支持人们的工作和决策,因而数据挖掘技术的研究就成了一种迫切的需要。同样,在现代的教育考试领域,大量的考生的数据和信息都通过计算机以数据的形式保存下来了,这些数据和信息同样蕴藏着大量的关于教育考试的各种潜在的信息规则,也需要数据挖掘对这些数据进行的研究和应用。论文首先讨论了数据挖掘的概念,介绍数据挖掘的环境---数据仓库,而后对数据挖掘的算法、使用的技术、实际的挖掘过程、数据挖掘的体系结构进行了研究。并根据数据挖掘的特点,分析、论证了在北京考试院自学考试系统考生流失分析需求使用数据挖掘的必要性,并根据实际的需求选择了决策树种的SLIQ算法作为解决实际工作需要的算法,详细的描述了SLIQ算法中的数据准备、分裂方法;通过与实际考生流失分析系统书及挖掘需求的结合,建立一个关于考生流失系统数据挖掘的数据仓库,按照SLIQ算法,通过对考生的公共课考试成绩、考试次数与考生毕业情况关系的分析,使用数据仓库中的考生数据进行决策模型的培训,建立了一个考生流失分析的决策树模型。并通过模型为北京市考试院为减少自考考生的流失的策略,做出理论的支持。
其他文献
电力系统设备检修管理是电网调度运行管理决策过程中的一个重要环节,其核心内容是检修计划的安排及检修申请票的提交、制定、签发、下达、执行,它对电网的安全、经济、稳定运
目的:观察慢性阻塞性肺疾病急性加重期(AECOPD)患者血浆中炎性介质与抗炎介质水平变化,阐明COPD全身炎症与肺功能的关系。方法:检测62例COPD急性加重期患者接受β-内酰胺类或
<正>在议论文写作构思过程中,常常需要对中心论点进行合理分割,如何分割好分论点,主要方法有三。一、并列分割中心论点所包括的内容,有的是并列联系。论证这类问题,务必围绕
经济全球化、信息技术的迅猛发展以及电子商务的广泛应用,使外贸企业的国际竞争日趋激烈。我国外贸企业要生存、发展,必须也只能在国际竞争中争夺生存空间。这就意味着,外贸
本文从信仰探源入手,概括分析了信仰的本质、特征及其作为一种精神现象的客观发展规律。信仰是人类社会普遍存在的精神生活方式,远古至今,它完成了从超自然向世俗化的革新,经
目的探究医联体模式下护理专科能力培训在提高社区护理服务质量,提升社区患者对于社区护理服务满意度的作用。方法从江门五邑地区一级﹑二级医院﹑社区医院等相关老年机构招收30
远志是Polygala tenuifolia和卵叶远志Polygala sibirica药用部位的根,为临床常用中药,始载于《神农本草经》,列为上品。言其味辛,苦泄温通,能助心阳,益心气,又能使肾气上交
期刊
<正>要想病理诊断有较好的质量保证,建立一套行之有效的质量控制体系,并系统贯彻执行就显得尤为重要[1]。实验记录作为质量控制体系文件的有机组成部分,也是完成体系中标准操
时间范畴是语言学的一个重要研究对象。时间范畴是通过语言各个层面的手段表达出来的,它们是词汇下段、词法手段、句法手段以及各种综合手段的总和。由于语言的构造不同,以及