论文部分内容阅读
数据挖掘就是从巨量数据信息中获取有意义的知识的过程,目前已经成为一个研究的热点。分类规则挖掘是数据挖掘的一个重要研究领域。在分类规则挖掘中,人们通过对历史或已知数据的分析,从而获得对未来或未知情况判断和预测的依据。
神经网络在分类问题中具有分类精度高、鲁棒性好等优点,但其知识蕴含在其结构中,不易为人所理解。粗糙集是一种处理不确定性和含糊性知识的数学处理工具,该方法不需要任何先验的知识就可以得到数据中所隐含的对我们有用的知识。但是粗糙集对数据中出现噪声比较敏感,而神经网络对于在数据中存在过量冗余信息时将导致训练过度。
本文融合粗糙集和神经网络各自的优势,对分类规则挖掘中的属性约简和规则抽取进行了深入研究。
本文的主要工作如下:
1.通过对粗糙集理论的深入学习研究,提出了一种基于规范化的二进制可辨矩阵及其属性约简算法。该方法适用于相容的和不相容的决策表信息系统,利用加权计算属性重要性的策略,有利于属性约简的最优求解。
2.研究了粗糙集和神经网络方法相结合的方法,提出了一种基于粗糙集和神经网络相结合的分类规则抽取算法。该方法充分融合了粗糙集强大的属性约简、规则生成能力和神经网络优良的分类、容错能力,生成规则简单准确,具有良好的鲁棒性。