论文部分内容阅读
随着科学技术的进步,现代工业过程日趋复杂,使得控制对象的精确数学模型难以建立,传统的控制理论和方法难以满足复杂控制系统的设计要求。为此,以软计算为主的各种智能控制理论为这类问题的解决带来了曙光,并在许多实际工业过程中获得了成功的应用。大多数的智能控制理论(例如模糊控制理论、基于专家系统的各种控制系统等)都是在专家知识的基础上进行研究和实践的。这就使得控制系统的性能对专家知识有着强烈的依赖性。而专家知识常常带有主观性和不可避免的片面性。这使得数据挖掘和知识发现成为智能控制理论发展的需要。数据库技术的迅速发展、数据库管理系统得到极其广泛的应用。数据的大量积累与共享使得数据挖掘和知识发现成为人类生活实际的需要。
数据挖掘是当前信息技术中的一个重要研究领域。应用软计算方法进行数据挖掘方法的研究是当前的一个研究热点。作为软计算方法之一的粗糙集理论是处理不确定的、不精确的、不完整的数据的新的数学工具,已经在机器学习、知识获取、智能控制、决策分析、知识发现、专家系统和模式识别等领域取得了一些成功的应用。它具有不需要除所需处理的数据集合之外的任何先验信息的特点和优势。将粗糙集理论应用于数据挖掘有着重要的理论意义和实际应用前景。
本文以粗糙集理论为工具,对数据挖掘的方法和过程进行详细的研究。主要包括知识发现与知识优化、广义信息系统及其粗糙集理论、几种扩展粗糙集理论的一般化和粗糙集和模糊集的关系的研究。全文主要分以下六部分:
第一部分:介绍本文研究工作的背景和本文用到的粗糙集理论的基本内容(包括第一、二章)。首先介绍研究的目的和意义,其次,简要介绍数据挖掘和粗糙集理论概况,然后,分析在基于粗糙集理论的数据挖掘中存在的不足和需进一步研究的问题,简要介绍本文的主要研究工作和结构安排。概括介绍粗糙集理论的基本内容。
第二部分:研究经典粗糙集理论的知识发现与知识优化问题(第三章)。首先,针对规则提取和面向个性化的知识发现问题,从类出发,运用聚类原理给出规则提取的方法,分析算法的性能。其次,研究基于粗糙集理论的确定性规则集的优化方法。给出确定性规则优化方法的理论依据,提出规则优化的“综合—剪枝”算法。最后,针对不确定性规则的优化规则的发现问题,利用描述的相关性和蕴涵强度的分析方法来判断正规则、负规则和描述的并发。同时,给出基于遗传算法的的优化规则的发现方法。通过结果分析,优化规则的提取效果明显,利于工程实现。
第三部分:研究广义信息系统和广义决策信息系统及其粗糙集理论(包括第四、五章)。在经典粗糙集理论、基于不完备信息系统的粗糙集理论和多值粗糙集理论的基础上提出广义信息系统及其粗糙集理论,并对其进行研究。讨论广义信息系统及其粗糙集理论的一些重要问题。首先,它是一类更广泛的信息系统。并证明了它包含完备信息系统、不完备信息系统、多值信息系统。这些信息系统仅仅是广义信息系统的一些特例。讨论广义信息系统粗糙集理论的基本理论和方法。决策信息系统是一类重要的信息系统,广义决策信息系统中的规则形式、规则发现、规则提取和结果评价等内容都是广义信息系统数据挖掘的重要的研究内容。讨论广义信息决策系统的决策描述形式,给出确定性规则和最佳规则的定义与相关性质。这种广义信息决策系统的决策描述形式非常易于将其转化为子句集的形式。因此,在人工智能的归结演绎推理中,广义决策信息系统的决策描述无论是在证明问题时还是在求取问题的答案时都将是简单和方便的。
第四部分:研究覆盖粗糙集和多值粗糙集的一般化问题(第六章)。通过对覆盖粗糙集理论和多值信息系统的粗糙集理论的研究,分别给出将其转化为经典粗糙集的方法。这使得覆盖粗糙集、多值信息系统的粗糙集理论与经典的粗糙集的概念、理论都达到统一。并使得经典的粗糙集理论的应用范围得到进一步的扩展。
第五部分:研究粗糙集与模糊集的关系的问题(第七章)。研究利用等价关系将粗糙集模糊化的方法,并从系统的角度,讨论给定近似空间上的所有粗糙集模糊化所形成的模糊集类的相关性质,并证明它是相应论域上的模糊集系统的子系统。但是,这个子系统是一类特殊的模糊子系统,在这个子系统中却不满足运算的传递性质。
第六部分:总结与展望(第八章)。对全文的工作进行总结,同时,对进一步的研究工作进行展望。