论文部分内容阅读
不断改进教育教学、提升人才培养质量是国家教育发展的核心任务。随着信息技术的发展,各领域数据量急剧增加,教育数据同样如此。学生考试成绩、图书借阅信息、消费记录以及考勤记录等共同构成了庞大的教育数据。如何利用日益增长的教育数据帮助教师提高管理能力和管理效率,帮助学生自查自省,提高自主学习能力,是目前智慧校园需要解决的核心问题。面对庞大的教育数据,如果仅依靠传统的处理方法,势必会造成一系列问题,如教师管理压力增大,部分学生无法获得及时指导等。因此,本文构建了一种学生学习行为分析模型,旨在运用现代信息技术促进教育教学发展,提高学习效率和学习效果,具体工作内容如下:(1)提出了一种层次多标签分类方法。针对目前多标签分类问题计算量大、标签间关系易被破坏和可解释性弱等问题,本文提出了一种基于簇状关系的层次多标签分类方法。该算法首先利用改进的K-means对样本集中的标签进行多次聚类,形成带有层次关系的标签簇;然后根据簇中标签选择基分类器训练数据,不仅能够降低训练成本,同时还能保留标签的相关性;在此基础上,将基分类器组合为多标签簇状聚类树,再利用集成思想将簇状聚类树构造为随机森林分类模型,提高算法性能和泛化能力。实验结果表明,该算法整体表现优于其它算法,特别在规模较大的数据集中,各项指标均排名第一。(2)提出了一种极端随机森林分类算法。极端随机树旨在通过增加随机性来提升算法泛化能力,而基分类器(决策树)随机性提升的同时,务必导致分类效果有所降低。基于以上特点,本文提出了一种自适应规模的极端随机森林分类方法。该算法首先选用一种与准确率相关联的投票机制来提升拟合能力;然后提出一种自适应选择参数方法,以默认参数为起点探寻最优的参数组合,平衡算法偏差(Bias)和方差(Variance)的关系。实验结果说明,该算法无论在分类效果还是泛化能力上都有较好的表现。(3)构建学习行为分析系统。根据学生学习行为数据特点以及研究需求,结合文中提出的两种算法,形成了学生学习行为分析模型,并以此模型为基础构建了学习行为分析系统。在该系统中,通过对数据库数据进行分析,完成学生个性标签标定,展示学生学习状态和学习能力,并探究影响较大的因素,形成结果报告,为教师管理和学生学习提供可靠的数据支撑。