C4.5经典分类算法的研究与改进

被引量 : 0次 | 上传用户:anshuly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
C4.5算法属于决策树算法,分类规则以树的形式视觉化呈现。C4.5算法的最大特点即建树规则易于观察与理解,并且分类速度快,分类器准确率高。但是C4.5算法也存在一些不足,本文针对C4.5算法在大数据背景下可能导致算法复杂度过大,效率低等问题,对C4.5算法进行了改进。算法的具体改进:根据信息增益率的计算公式,利用数学的泰勒公式及麦克劳林公式的核心思想并结合等价无穷小的性质提出一种改进的C4.5算法,减少了信息增益率的计算复杂度,进而加快了C4.5算法的信息增益率的计算速率。改进的C4.5算法与传统的C4.5算法相比,在构造决策树是具有相同的准确率和更快的计算速度,并将改进后的C4.5算法应用到高校学生的成绩分析中。
其他文献
随着经济全球化的发展和南北差距的拉大,国家和地区间的移民不断增加,其中“劳动移民”(也称“移民工人”)占有较大比重。各国政府和工会越来越关注劳动移民问题,纷纷采取对
对中国矿业大学安全工程学院2012级和2013级本科生的“矿井通风”课程中运用了研讨式教学法。采用课堂实践和问卷调查,对本科生在研讨式教学实践中的活动组织、报告小组研讨学
“河南队加油、河南队加油”“程政彪加油、程政彪加油”……2020年6月6日上午,此起彼伏的助威声伴随着响亮的掌声,回响在河南省体工大队武术套路训练馆。训练馆并非比赛现场
文章从关注流程的角度出发,为提升我国高校管理信息化水平给出一个新的视角。通过总结复旦大学管理信息化的建设实践,阐述了信息化与大学战略的关系,着重介绍了复旦大学在业
目前我国采用的企业绩效评价方法大都存在着一些缺陷,应采用多因素全面评价原则和定量分析与定性评议相结合的原则,建立多维的基于绩效预算管理的动态的企业绩效评价体系。
本文通过高低频混装连接器的合理设计,实现高低矩形频混装多头电缆的设计。通过Ansoft HFSS软件仿真解决高频性能要求。通过混装连接器的结构设计,实现高频信号、低频信号的
应用民族音乐学是近几年民族音乐学研究中出现的新词汇,国内外学界对于它的定义、研究边界、内容要素等还存在许多不同认识,正因为如此,有必要对于这门学科进行更深和更为广
随着中国资本市场不断成熟及国际化进程地加快,在国外早已盛行的价值投资思想也日渐被A股的投资者所吸收。在价值投资的理念中,如何对企业的内在价值进行评估是构成投资决策