论文部分内容阅读
教育数据挖掘(Educational Data Mining,简称EDM)技术是一个涉及到计算机技术、教育学和统计学等多学科的交叉研究领域,是数据挖掘技术在教育领域的扩展和应用。如今,伴随着互联网和信息技术在教育环境中的快速普及,教育相关数据的收集变得越来越高效,EDM研究也越来越受到教育研究者的重视。学生成绩预测是最早也是最流行的EDM应用之一,具有较高的实用价值和一定的学术研究意义。现有的关于成绩预测研究的数据大多来自于专门的数字化教学软件和智能教学系统等,研究成果具有较强的针对性,但仅适用于分析特定系统,缺乏通用性。为了能够得出较为普遍的成绩预测模型,本文使用学生的日常上网数据预测学生学术表现。通过研究证实,使用学生日常上网数据可以对学生《数据结构》课程的成绩进行预测,有一定的实际应用价值。本文所做工作主要包括以下几部分内容:1、分析当前有关EDM研究的研究现状,介绍课题的研究背景和主要研究内容。在研究开始之前,本文对相关的基础知识进行讲解,如数据挖掘的定义与原理等背景知识、EDM研究特点与EDM在国内外的教育实践、机器学习的定义、朴素贝叶斯分类法和逻辑回归分类法的基本原理等。2、对学生上网记录的原始数据集进行了预处理。对研究所用到的数据进行了介绍,包括对数据来源、数据格式和数据特点等的介绍。在EDM建立模型之前,数据预处理工作是最重要的环节之一,该阶段的质量对整个EDM项目的成果好坏起到关键的作用,本文将详细介绍数据预处理的过程。3、提出使用学生日常上网日志数据预测学生学术表现的方法。通过实验,使用朴素贝叶斯分类法和逻辑回归分类算法在六种不同数据集上建立预测模型预测学生《数据结构》课程成绩是否合格,对预测结果进行评估和对比,并介绍该方法在实际系统中的应用。4、得出使用学生日常上网数据预测学术表现可行的结论,分析研究中的不足并提出相应的改进方法,展望今后的相关工作。本文证实了学生日常上网行为与学术表现是有一定关联的。使用上网数据可以成功识别出成绩不合格学生中65%以上的学生,同时对成绩合格学生的识别成功率达到88%,研究发现浏览更多在线视频和更少技术类网站的学生更有可能在《数据结构》课程中成绩不合格。研究方法应用到实际系统可以帮助教师及早帮助学业困难的学生,提高学生成绩,有比较好的实用价值。