【摘 要】
:
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个
【机 构】
:
东北大学软件中心,大连东软信息学院网络安全与计算技术重点实验室
【基金项目】
:
国家自然科学基金资助项目(61772101,61602075),辽宁省重点研发计划项目(2018).
论文部分内容阅读
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁
其他文献
CPU体温哪里看 CPU是电脑配件里最重要同时也是“火气”最大的成员,尤其是那些早期架构或者超频使用的CPU。运行起来的温度是非常高的,用户稍有不慎就有可能烧掉CPU。因此,各种各样的CPU温度监控方法以及五花八门的降温软件也应运而生。
语文在我国教学中属于基础性学科,在教学过程中,语文教学应注重学生综合能力的培养,尤其是学生的理解能力和鉴赏能力,因此,在教学中应不断变换教学方法,丰富课堂形式。根据新课改要
从2011年9月秋学期始,初中思想品德课已在全国范围内使用根据《全日制义务教育初中思想品德课程标准(实验稿)》(以下简称“新《课程标准》”)编写的《思想品德》新教材。与旧教材
《语文课程标准》(实验稿) 强调指出 “学生是学习和发展的主体.” 素质教育要求我们必须把学生从传统的被动的受教地位转变主动求知的地位上来.语文是一门母语学科, 有非常广
目的 探讨中药颗粒剂与饮片用于治疗风热感冒的临床疗效。方法选取2010年8月-2011年8月就诊的风热感冒患者46例,随机分为观察组和对照组各25例,其中观察组给予忍冬感冒颗粒,对照
制造业是我国的支柱产业,其自主创新关系着国计民生,制造业自主创新也是建设创新型国家的首要任务。外商直接投资的进入为我国带来了机遇与挑战。我国企业既要学习模仿,又不能照
随着信息技术的不断发展,多媒体技术成为了时代的标志,同时它也成为了课堂教学的重要手段。很多教师在授课过程中都采用多媒体教学的方式,通过这种方法,营造一种良好的学习氛围,从
中考复习紧扣《课标》和《考试说明》,注重基础,回归教材,帮助学生建构生物学的知识结构和知识体系,关注生活,学以致用,注重对学生能力的培养,关注学生的情感态度和价值观。
在小学美术课堂教学中,“学生作业”这环节是学生将本课所学的知识技能运用和施展的关键时刻.新课程打破了原有沉寂的美术课堂,给美术课带来了生机与活力,使美术学习走进了学
在体育教学中,“启发式”教学是体育教师作好组织、启发、引导,让学生真正处于主导地位,充分发挥其主观能动性,达到身心全面发展,培养学生的对体育运动的兴趣,为学生树立终身