论文部分内容阅读
随着近年来我国高校的不断扩招,我国的高等教育实现了阶段性的跨跃式发展,学生人数的增多,学生信息也越来越庞大。为促进学生信息管理的现代化,提高管理、教学质量,在信息收集、归类和管理分析的同时,建立一个方便、快捷、准确地分析、评价学生的学生信息管理系统,并应用数据挖掘技术寻找隐藏在学生信息里面的特征属性,预测学生的各方面的发展趋势,为学校管理、教学提供重要的科学决策依据。本文首先通过SQL Server 2005建立了地球物理与信息技术学院的学生信息成绩数据库,数据来源自地信学院2003年到2009年汇集的所有学生信息,主要包括自2003级至2008级本科生6个年级36个自然班近1200名学生的学籍基本信息和总计7万余条的成绩信息,以及2007届至2009届本科生的就业情况。对数据进行详细的分析整理之后建立了学生学籍信息表,学生成绩表,班级表,课程表等表单,并通过SSIS(SQL Server Integration Services)技术对数据库进行了数据仓库的提取、转换和加载,建立起了良好的数据仓库,为之后的数据挖掘建立了数据基础。在此数据库的基础上使用Delphi建立windows可视化界面,通过pascal语言编写主代码,主要使用了ADO数据库控件通过SQL语言实现了插入、修改、删除以及更新学生各项信息的功能,界面友好,查询速度较快,具备主流学生信息管理系统的各项功能。在此数据库基础上,提出了一种应用决策树技术来挖掘隐藏在学生成绩背后有价值信息的研究方案,详细分析了应用决策树技术挖数据信息的具体步骤,并对决策树的主要算法及其基本思想进行了归纳、分析研究,对各种算法之间的差别进行了客观地比较。分析了现有对学生成绩分析的不足,针对学生成绩分析的重要性和作用,采用调查表等方式收集数据,并对数据进行了预处理,利用C4.5算法生成了学生成绩分析决策树模型,并由此产生了分类规则。本文以作者所工作的学院为例,提出了一种应用决策树技术挖掘隐藏在学生数据背后有价值信息的研究方案,为今后的管理、教学工作提供重要的决策依据。