论文部分内容阅读
决策树是归纳学习和规则提取的一种重要方法,已经被广泛应用于数据挖掘和机器学习等领域。由于基于信息增益构建决策树的方法存在内在偏置,所以,针对该方法可能存在的特征选择不当而导致规则置信度降低、特征排序不当等问题,提出一种使用样本对构建决策树的新方法。首先,为了保持所有确定规则的置信度不变,定义了极小特征集合来删去冗余特征,并用极小特征集合建立了极小决策树;其次,通过样本对选择的方法设计了构建极小决策树的算法;最后,用实例验证了该算法的可行性。