优化的C4.5决策树算法

来源 :软件 | 被引量 : 0次 | 上传用户:yangfei223752
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统C4.5算法思想计算量大,在明确的先验知识情况下不能建立更优的决策树,影响了决策树生成时间及结构。根据数学上等价无穷小性质减少信息增益率的计算量,采用全局优化策略弥补简化所引起的误差,进而提高计算效率。在优化中考虑先验知识的特殊情况引入平衡度系数,实现C4.5算法的优化分枝策略,建立更符合实际情况的决策树。实验证明,优化的方案与C4.5算法相比决策树具有大致相同的分类准确率和更高的生成速度。
其他文献
通过对玉米秆、小麦秆、棉花秆、稻草、松木屑等生物质进行热重分析和差热分析,分析了生物质气化过程的裂解机理。研究中采用松木屑作为气化原料,得出了气化温度、压力、水蒸气
介绍城市配电网保护现状,分析光伏电源在电网发生短路故障可能出现稳态的短路电流、并网不稳定以及孤岛效应,对配电网的准备性、灵敏度、选择性、快速性产生较大的影响,建议
在冶金企业的日常生产运行过程中,锅炉是其系统中的关键设备之一,锅炉的安全、高效、稳定运行,不仅关系到企业运行的效率,还影响着企业的环保效果和经济利益。锅炉是冶金生产
大学生科技创新训练计划(STITP)项目孵化各阶段中,指导方对各评估属性存有心理期望。本文提出的STITP孵化满意度及其组合赋权分析,即利用心理期望与实测数据取得属性满意度,并参照
互联网时代,在校学生的网络信息伦理是我们应该关注的问题。本文试从高校图书馆信息伦理建设的角度.探讨如何通过信息伦理建设对在校学生的网络信息伦理起到引导和影响的作用。
近年来,随着电力体制改革的深化和能源竞争的加剧,优质服务越来越成为供电企业赖以生存和发展的基础。优质服务取得了一定成果,但在实施过程中仍然存在一些问题,针对目前普遍存在