一种改进的决策树算法研究与应用

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:xaly001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树算法在数据挖掘技术中有重要的作用,本文着重研究了决策树理论中的C4.5算法,针对其在当训练集样本包含大量的连续值属性时,算法将会效率低下的缺点,提出了利用划分熵取得最小值的改进方法,得出对连续值属性离散化处理时,只需对其其边界点进行计算,降低连续值属性离散化的时间复杂度。同时对求解信息增益率的公式进行了简化。本文改进了一种决策树的简化模型。使之能利用信息增益度量选择测试属性,得到最为合理的测试属性,也使得属性选择度量的信息理论含义清晰,可解释性明确。本文设计实现了一个学生成绩预测系统,以C语言典型课程为例,挖掘该课程成绩与哪些因素相关,哪些是决定性因素,使教师针对不同类型的学生采用不同的教学方法和教学侧重点,提高该课程成绩。
其他文献
随着Interact的不断发展和普及,Web应用系统得到了广泛的使用。进入Web2.0时代以来,基于框架的Web开发逐渐成为主流开发技术。由于Web应用的分层开发及框架本身限制,单一框架很
随着计算机软、硬件技术的迅速发展,高性能计算逐渐在越来越多的行业中得到应用。并行计算是实现高性能的一种重要的技术途径,其关键环节是并行程序设计。串行程序并行化作为
? ? ? ? ? ?随着Internet的迅猛发展与普及,以及宽带网络建设的日益完善,网络开始带给人们形式多样的信息。从在网络上出现第一张图片到现在各种形式的网络视频、三维动画,人
本文所研究的限量弧路由问题(Capacitated Arc Routing Problem,CARP)是一个经典的组合优化问题。它在现实中具有非常广泛的应用,如冬季撒盐路由、城市垃圾清理、信件投递等现
在高性能计算技术研究领域,机群系统具有良好的可扩展性与高性价比,受到越来越多的大学及科研机构的青睐。随着计算机集成技术的不断发展,多核技术开始大行其道,双核及四核的处理
计算机网络经历了网络互联、万维网,正在向大规模的分布式网格计算阶段发展。网格计算是把Internet上的计算资源、存储资源、服务资源等信息资源虚拟化并集中为可共享的服务
蒙古语词切分是蒙古语信息处理中的一个基础课题,具体内容是利用计算机自动识别出构成蒙古语词的词干与词缀。蒙古语的词干与词缀中包含大量的语法信息,利用这些信息有助于提
指纹被用来作为个人的身份识别与认证已经历了漫长的岁月。随着科学技术的不断发展,指纹识别技术已被人们公认为个人生物特征识别的物证之首。指纹识别一直是模式识别领域内热
随着Internet的高速发展,计算机技术也进入了以网络为中心的发展时期。网络服务正朝着高效率,低响应时间,高吞吐量的方向发展。人们对高效率和高可靠性的追求,给应用服务器带
随着互联网技术的发展,网络已经对人们表达自己和与他人互动的方式产生了巨大的影响。在线评论在今天的电子商务中起到至关重要的作用,消费者常常会通过网络查看商品或者商店