论文部分内容阅读
近年来,随着互联网技术的飞速发展,大数据逐渐成为各行各业关注的热点。如何利用教育大数据进一步增强教学效果、提高人才培养的质量成为教育领域研究的重要问题。本文从学生行为大数据入手,就高校学生学业成绩进行了预警分析,为高校管理者进行决策参考。首先,依托某高校的联机事务处理系统获取了该校2017年全年的学生行为数据,将原始的非结构化、半结构化数据进行清洗形成可以用于分析的结构化数据,并对相应的变量进行了缺失值、异常值处理以及数据标准化;其次,针对数据集变量多的特点,利用了主成分分析和主基底分析两种降维方法,形成两个新的变量集,将样本按照9:1的比例分成训练集和测试集,并基于新的变量集分别对训练集进行了多元回归分析,通过评估和比较,选择了主基底分析所生成变量集作为自变量建立模型,并利用成绩预测模型得出该高校将有448名学生下学期学业成绩严重落后,并向高校管理者建议对这448名学生做出学业预警,同时通过研究预测模型的变量系数以及变量之间的相关关系发现,周末外出比例高、自习次数多、家庭贫困度正常、喜欢浏览学业与求职方面网页的学生学业表现较好,建议学校多向这些方面引导学生。本文克服了传统研究中只利用各科成绩以及各科任课教师水平等单一因素来分析学生学业成绩的不足,而侧重于学生行为轨迹中的诸多因素对学生学业成绩的影响分析。但由于数据获取条件限制,本次研究在指标选取和研究方向上还有不足的地方,可以在以后的研究工作中加以改进。