基于数据挖掘的信息管理与信息系统专业课程设置研究

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:hyz3059611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:数据生成和收集技术的进步促使商业和科研领域产生了海量数据。传统数据分析技术在应对这些新型数据集提出的挑战时存在种种局限性,数据挖掘技术迎刃而解了这些问题。本文应用数据挖掘中关联规则的Apriori算法来进行成绩的关联分析。文中通过举例说明了该方法在分析学生成绩数据中的应用,实验结果表明,关联分析方法比传统的成绩统计方法更合理、更科学,蕴含更多有用的信息。
  关键词:数据挖掘;关联分析;Apriori算法;课程设置研究
  中图分类号:TP311.52
  数据挖掘这种技术将传统的数据分析方法与处理大量数据的复杂算法相结合。目前,在电信、银行、百货公司、超市、保险、信用卡、电子商务、税务部门、警察机关、医学等领域均有应用。现在的高校也有海量的学生相关数据,但这些数据几乎没有被有效利用,本文应用关联分析方法,通过对学生的成绩进行统计和分析,从中可以获得课程设置及教学改革的理论依据。
  1 数据挖掘的概念和相关技术
  数据挖掘是在海量的数据中,发现数据之间隐含的有用的信息的过程。数据挖掘技术除了用来在大型数据库中发现先前未知的有用信息之外,数据挖掘还可以预测未来,比如,预测一位顾客在超市中的购买行为。
  不是所有的信息分析都叫做数据挖掘。比如,在数据库中查找某条信息,或利用因特网的搜索引擎查找某个Web页面,这只是信息检索,而不是数据挖掘。
  数据挖掘的技术主要有:分类、关联分析、聚类、人工神经网络和粗糙集等。下面主要对在信息管理与信息系统专业课程设置研究中适用的几种技术作一些介绍。
  1.1 关联分析
  关联分析是用于发现隐藏在大型数据集中的有意义的联系的方法。这些联系可以用关联规则或频繁项集的形式表示。比如:{尿布}→{啤酒},这个规则显示了尿布和啤酒的销售之间存在着很强的联系,因为许多购买啤酒的顾客也买了尿布。关联分析还应用于其他领域,如生物信息学、医疗诊断、网页挖掘和科学数据分析等。
  1.2 分类与预测
  分类的任务是确定对象属于哪个预定义的目标类。这是一个普遍存在的问题,有许多不同的应用。比如:通过电子邮件的标题和内容对垃圾邮件进行屏蔽,根据核磁共振扫描的结果区分是恶性肿瘤还是良性肿瘤等。预测是利用分析所获得的模型对未知类型的数据对象进行类别的预测。
  1.3 聚类
  聚类分析只是根据在数据中发现的描述对象及其关系的信息,并将这些数据对象分组。目的是,组内的这些对象是相似的,而不同组中的对象是不相似的。组内的相似性越大,组间差别越大,聚类就越好。
  2 数据挖掘在课程设置研究中的应用
  学校的教务处存放着学生每学期的课程成绩,学生处存放着所有在校学生的家庭基本信息,系部存放着每学期学生对所学课程的评价及打分信息,由于每学期的滚动,就产生了大量学生相关的数据,利用这些数据并结合数据挖掘的技术可得到这些数据隐含的有用的关系,比如课程模型。
  一门课程的学习,首先是先要完成它的先修课程,先修课程的学时长短、教授深度等,都会对这门课程的学习有影响。应用数据挖掘中的关联分析可找出课程之间的关联关系,使课程的调整有理论依据且更科学。
  学生的成绩与其家庭背景之间也有着关联,学校的数据库中含有学生基本情况的历史数据,我们想知道学生的成绩与其家庭背景的关系。学生成绩是否与课余打工、单亲家庭、未加入辅导计划、学习障碍、新近转学、经常缺席等因素有关。
  3 学生成绩的数据挖掘过程
  3.1 确定挖掘任务
  学校的教务系统中存放着大量学生成绩数据,而只是对这些成绩做一些求总分、加权平均和排名等简单的操作。这些数据表面上显示的是学生学习的好坏和兴趣,实际上隐藏着课程设置及教学方法改进的信息。
  3.2 准备数据
  学校的各个部门都有大量的学生数据,每个学期都会产生新的数据,我们从这些海量数据中收集学生的成绩及学生的信息等数据作为要分析的数据。
  3.3 算法设计
  数据挖掘是一项从大量的记录数据当中找出有价值的、人们感兴趣的信息,这些信息是隐含的、事先并不知道的有用信息,发现的知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regular ides)、模式(Patterns)等形式。关联规则是本文中分析成绩的主要方法之一,它反映的是事物与事物之间相互关联性和依存性。如果两个或多个事物之间存关联关系,可通过其中的一个事物预测出另一个事物。在这里我们用Apriori算法,首先产生频繁1-项集L1,然后是频繁2-项集L2,直到有某个r值使得Lr为空,算法停止。在第k次循环中,过程先产生候选k-项集的集合Ck,Ck中的每一个项集是对两个只有一个项不同的属于Lk-1的频繁集做一个连接来产生的。Ck中的项集是用来产生频繁集的候选集,最后的频繁集Lk必须是Ck的一个子集。一个项集是频繁集当且仅当它的所有子集都是频繁集。如果Ck中某个候选项集有一个(k-1)-子集不属于Lk-1,则这个项集可以被修剪掉不再被考虑。算法如下:
  L1={频繁1项集};
  for(k=2;Lk-1??;k++) do begin
  Ck=apriori_gen(Lk-1); //新的潜在频繁项集
  for all transactions t?D do begin
  Ct=subset(Ck,t); //t中包含的潜在频繁项集
  for all candidates c?Ct do
  c.count++;
  end;
  Lk={c?Ck|c.count?minsup}   end;
  Answer=UKLK
  3.4 数据挖掘
  数据是某班学生的大学四年的学习成绩,学生人数为33人。表1显示了该班部分学生第一学年的学习成绩,共有32门课程,这些课程可以分为2类:专业课,其中包括高等数学(简称“高数”)、线性代数、概率论与数理统计(简称“概率”)、数据库技术、计算机原理、C++程序设计(简称“C++”);公共课包括英语、体育。有些课程是连续上2-4个学期的,如英语要上4个学期,高等数学要上2个学期,对于同一门课程不同学期的成绩,分别在课程名后用1-4表示相应学期。
  表1 某班学生部分成绩
  3.5 结果分析
  高等数学成绩好的学生,C++也学得好;数据可技术学得好的学生,C++和计算机原理学得也好;英语学得好的学生,C++,计算机原理和数据库学得也好;计算机原理对其它专业课程没有影响;网页设计这门课学得好的学生,ASP.NET学得也好。针对信息管理与信息系统专业现有的课程设置,可以给出以下几点建议:C语言每周设为6学时,加大总的学时及周学时,加强实践教学;计算机组成原理与其他专业课的联系不大,可以减少学时;加强网页设计这门课程的学习,这门课与ASP.NET的联系很紧密;高等数学和英语这两门基础课应加大学时,尤其是高等数学,它们对后续的编程语言的学习很重要;VB这门课程可以去掉,编程课程从C语言入门就可以,C语言和C++这两门课可以合在一起来上,学完C之后可马上开C++而不需要分在两个学期来上。
  4 结束语
  利用数据挖掘工具对学生相关数据进行分析,可以得到一些隐含的信息,而这些信息是要对挖掘的结果进行深入的分析才能得到的,从中找出最合理的建议,给决策者提供参考依据。
  参考文献:
  [1]刘晓庆.浅析数据挖掘的研究现状及其应用[J].电脑知识与技术,2006.
  [2]常桐善.数据挖掘技术在美国院校研究中的应用[J].复旦教育论坛,2009(02):74.
  [3]陈丽.基于数据挖掘建立动态人事管理决策系统[J].计算机工程与应用,2001(20).
  [4]陈卓明.数据挖掘在国内外的研究和发展现状[M].青年文学家,2009(16).
  [5]刘美玲.数据挖掘技术在高校教学与管理中的应用[J].计算机工程与设计,2010(31).
  作者简介:柳原(1981-),女,山西人,教师,中级,学士学位,研究方向:数据挖掘。
  作者单位:包头医学院 计算机科学与技术系,内蒙古包头 014040;内蒙古科技大学 信息工程学院,内蒙古包头 014010
其他文献
摘 要:系统采用SQL Server数据库作为后台数据库,运用JSP技术编程实现。通过测试,系统实现了用户管理和新生入学报到、新生宿舍安排、新生缴费等功能。新生报到系统为新生提供方便、高效、一体化的入学报到环境,加强各个部门之间的信息流通和工作配合,使新生信息能够及时、准确更新,从而提高学校各部门的工作效率。  关键词:JSP;管理系统;新生报到管理系统;一体化  中图分类号:TP311.52  
期刊
摘 要:随着我国社会水平的提高,科学技术的发展,互联网技术也被应用到了我国各个行业之中。而就在互联网技术被得到广泛应用的过程中,网络信息安全问题也逐渐引起了人们的重视,而最近几年出现的几次重要信息安全事故也为网络信息安全敲响了警钟。在本文中,将就计算机网络信息安全及防护策略进行一定的分析与研究。  关键词:计算机;网络信息安全;防护策略  中图分类号:TP393.08  近年来,计算机网络技术得到
期刊
摘 要:信息化教学这种全新的教学模式改变了传统的教学结构,变学生的被动接受为主动学习,教师变成了课堂的组织者。信息化教学在实施的过程中需要有相应的硬件和软件作为支撑,笔者从几个方面对如何建设高质量的信息化课堂,这种新的教学方式进行了探索。  关键词:信息化教学;教学设计;信息化课堂;多媒体资源  中图分类号:TP391.6  现代科技带来生活的巨变,我们在生活中获取信息的方式也发生着变化。我们曾经
期刊
摘 要:计算机时代已经来临,信息技术的浪潮正在改变着我们生活的世界。在中等职业学校教学中开展更为具体、实用的计算机课程的教学,不仅是教育改革的明确要求,更是广大学生自身成长的迫切愿望。Scratch课程是中小学阶段信息技术课程的重要内容,在中职信息技术教学中的地位也是十分独特的,应该引起一定的重视。本文正是以此为切入点,着重阐述了新时期中职Scratch编程教学的几种有效思路和方法,重点结合Scr
期刊
摘 要:随着在籍党员人数的不断增加,人才交流中心党员管理的难度和复杂度越来越大。为此,在充分调研的基础上将移动云计算与流动党员管理平台相结合,提出设计开发一个党员管理信息系统。经实践证明,系统运行后,流动党员管理的效率大大增强。  关键词:党员管理;信息系统;移动云计算  中图分类号:TP391.3  流动党员管理是党建工作中重要的日常性工作,随着人才服务中心党员规模的不断扩大,管理日趋复杂。为了
期刊
摘 要:嵌入式防火墙(Embedded Firewall),亦为EFW,是计算机技术领域出现的一种新型防火墙技术,该技术以ARM处理器为载体,将现今计算机的安全策略延伸到网络末端。其安全措施由计算机所配置的硬件系统实施,有效突破了以往传统防火墙所存在的众多弊端,为众多企业的网络信息安全提供保障的同时,更在现今的计算机安全领域建立了更完善的安全防护架构。  关键词:防火墙;EFW;嵌入式;计算机网络
期刊
摘 要:本科毕业生在理论基础与应用能力之间存在着很大差异,挖掘内在的差异需要一个科学的评估方法,在评估方法之上,具体地确定和实施教改方案。本文将把逻辑特征映射人工神经网络应用于本科毕业生理论基础与应用能力评估上,对学生理论基础与应用能力做出一个全面、客观、科学的评价,为高校决策者提供重要且准确的决策依据。  关键词:教学评估;逻辑特征映射;决策  中图分类号:TN957.51  逻辑特征映射人工神
期刊
摘 要:无线传感器网络是一种崭新的信息获取和处理技术,集成了传感器、网络、无线通信和嵌入式系统四大技术而形成。它是一项全新的无基础设施的无线网络,能够随时监控、感知和获取各种物理环境或监控对象的信息,并对其展开处理、传输到需要这些信息的用户手中。嵌入式系统是当前电子计算机的一种较普遍应用形式,此类电子系统不易被用户注意,也可称它为埋藏式计算机。本文主要介绍在无线传感器网络的系统组成、工作原理与嵌入
期刊
摘 要:随着科技的不断发展,科研人员在建立数据和数据传输的时候,不再通过单一的途径来完成相关工作,而是根据用户的具体需求来决定采用何种方式。目前,综合业务数字网也得到了良好的建立,并且在一定程度上得到了较大的发展。综合业务数字网指的是统一数字交换设备和数字信道用来开通多种业务。本文主要对数字通信网管理发展的挑战和趋势进行一定的阐述。  关键词:数字通信网;管理;发展;挑战  中图分类号:TN915
期刊
摘 要:在当今我们科学技术的不断进步下,通讯系统的发展显得尤为明显,而在通讯系统中,智能的无线通信就至关重要。在本文中,我们首先阐释了什么是通信网络,在通信网络中有无线通信和有线通信,在此我们重点讨论无线通信的智能化问题,即电力自动化通信网络。我们就国家整个电网来说,占据核心地位的就是电力通信体系,在这个体系中,可以确保电网的高度安全,有效性,还可以实现电网自动化。于此电力的主要基站和第二次进行传
期刊