论文部分内容阅读
针对粗集规则存在的问题,提出了一种基于信息熵的属性简约算法,该算法以信息熵作为属性约简的标准,充分利用数据所蕴含的统计信息,克服了粗集γ准则对数据噪声的敏感性和不能表达属性间概率因果关系的缺点,理论分析和实例表明,该算法得到的规则集比基于粗集γ准则算法得到的规则集更简练,分类效果总体上也更优、在大多数工业应用中数据往往被各种噪声所污染,属性间也很难找到确定性关系,因此该方法具有比基于粗集准则方法更广泛的适用性。