论文部分内容阅读
传统C4.5算法思想计算量大,在明确的先验知识情况下不能建立更优的决策树,影响了决策树生成时间及结构。根据数学上等价无穷小性质减少信息增益率的计算量,采用全局优化策略弥补简化所引起的误差,进而提高计算效率。在优化中考虑先验知识的特殊情况引入平衡度系数,实现C4.5算法的优化分枝策略,建立更符合实际情况的决策树。实验证明,优化的方案与C4.5算法相比决策树具有大致相同的分类准确率和更高的生成速度。