数据挖掘与知识优化的粗糙集方法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:lxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的进步,现代工业过程日趋复杂,使得控制对象的精确数学模型难以建立,传统的控制理论和方法难以满足复杂控制系统的设计要求。为此,以软计算为主的各种智能控制理论为这类问题的解决带来了曙光,并在许多实际工业过程中获得了成功的应用。大多数的智能控制理论(例如模糊控制理论、基于专家系统的各种控制系统等)都是在专家知识的基础上进行研究和实践的。这就使得控制系统的性能对专家知识有着强烈的依赖性。而专家知识常常带有主观性和不可避免的片面性。这使得数据挖掘和知识发现成为智能控制理论发展的需要。数据库技术的迅速发展、数据库管理系统得到极其广泛的应用。数据的大量积累与共享使得数据挖掘和知识发现成为人类生活实际的需要。 数据挖掘是当前信息技术中的一个重要研究领域。应用软计算方法进行数据挖掘方法的研究是当前的一个研究热点。作为软计算方法之一的粗糙集理论是处理不确定的、不精确的、不完整的数据的新的数学工具,已经在机器学习、知识获取、智能控制、决策分析、知识发现、专家系统和模式识别等领域取得了一些成功的应用。它具有不需要除所需处理的数据集合之外的任何先验信息的特点和优势。将粗糙集理论应用于数据挖掘有着重要的理论意义和实际应用前景。 本文以粗糙集理论为工具,对数据挖掘的方法和过程进行详细的研究。主要包括知识发现与知识优化、广义信息系统及其粗糙集理论、几种扩展粗糙集理论的一般化和粗糙集和模糊集的关系的研究。全文主要分以下六部分: 第一部分:介绍本文研究工作的背景和本文用到的粗糙集理论的基本内容(包括第一、二章)。首先介绍研究的目的和意义,其次,简要介绍数据挖掘和粗糙集理论概况,然后,分析在基于粗糙集理论的数据挖掘中存在的不足和需进一步研究的问题,简要介绍本文的主要研究工作和结构安排。概括介绍粗糙集理论的基本内容。 第二部分:研究经典粗糙集理论的知识发现与知识优化问题(第三章)。首先,针对规则提取和面向个性化的知识发现问题,从类出发,运用聚类原理给出规则提取的方法,分析算法的性能。其次,研究基于粗糙集理论的确定性规则集的优化方法。给出确定性规则优化方法的理论依据,提出规则优化的“综合—剪枝”算法。最后,针对不确定性规则的优化规则的发现问题,利用描述的相关性和蕴涵强度的分析方法来判断正规则、负规则和描述的并发。同时,给出基于遗传算法的的优化规则的发现方法。通过结果分析,优化规则的提取效果明显,利于工程实现。 第三部分:研究广义信息系统和广义决策信息系统及其粗糙集理论(包括第四、五章)。在经典粗糙集理论、基于不完备信息系统的粗糙集理论和多值粗糙集理论的基础上提出广义信息系统及其粗糙集理论,并对其进行研究。讨论广义信息系统及其粗糙集理论的一些重要问题。首先,它是一类更广泛的信息系统。并证明了它包含完备信息系统、不完备信息系统、多值信息系统。这些信息系统仅仅是广义信息系统的一些特例。讨论广义信息系统粗糙集理论的基本理论和方法。决策信息系统是一类重要的信息系统,广义决策信息系统中的规则形式、规则发现、规则提取和结果评价等内容都是广义信息系统数据挖掘的重要的研究内容。讨论广义信息决策系统的决策描述形式,给出确定性规则和最佳规则的定义与相关性质。这种广义信息决策系统的决策描述形式非常易于将其转化为子句集的形式。因此,在人工智能的归结演绎推理中,广义决策信息系统的决策描述无论是在证明问题时还是在求取问题的答案时都将是简单和方便的。 第四部分:研究覆盖粗糙集和多值粗糙集的一般化问题(第六章)。通过对覆盖粗糙集理论和多值信息系统的粗糙集理论的研究,分别给出将其转化为经典粗糙集的方法。这使得覆盖粗糙集、多值信息系统的粗糙集理论与经典的粗糙集的概念、理论都达到统一。并使得经典的粗糙集理论的应用范围得到进一步的扩展。 第五部分:研究粗糙集与模糊集的关系的问题(第七章)。研究利用等价关系将粗糙集模糊化的方法,并从系统的角度,讨论给定近似空间上的所有粗糙集模糊化所形成的模糊集类的相关性质,并证明它是相应论域上的模糊集系统的子系统。但是,这个子系统是一类特殊的模糊子系统,在这个子系统中却不满足运算的传递性质。 第六部分:总结与展望(第八章)。对全文的工作进行总结,同时,对进一步的研究工作进行展望。
其他文献
随着数据采集系统、信息家电、工控行业和嵌入式系统应用的不断丰富和增加,用户对这些系统中数据存储的速度要求越来越快、数据量越来越大,同时,还要求具有很高的可靠性和稳
对钢坯热轧过程以节能降耗为目标的控制模型和控制方法的研究,一直是钢铁冶金自动化领域的研究重点之一,但以往的研究多集中于钢坯加热过程或者轧制过程,割裂了两者在生产上的连
电加热炉是典型的工业过程控制对象,在我国应用广泛。电加热炉的温度控制具有升温单向性、大惯性、大滞后、时变性等特点。其升温、保温是依靠电阻丝加热,降温则是依靠环境自然
随着分布式人工智能技术的发展,多机器人系统的研究得到越来越多的关注。多机器人系统在大型船舶制造,现代物流系统中的仓库管理,空间探测,无人作战系统,还有社会和家庭服务
任务规划模块是自动驾驶系统中的上层管理模块,需要综合考虑用户任务、动态交通信息以及车辆状态,快速自主地规划最优全局路径并提供每个任务的相关信息。纯电动汽车因为其环
免疫生物学研究表明,人精子细胞和溶脲脲原体(简称UU)存在着交叉反应抗原(又称交叉抗原)。筛选鉴定这些交叉抗原对阐述UU致男性不育机理以及研制避孕疫苗具有重要意义。传统
物流服务渠道是指包含第三方如设备制造商(Original Equipment Manufacture,OEM)、OPM及工业品超市等,企业自身和供方提供物流服务的途径。大中型企业在全球化MRO采购的决策过
流量测量在节能、环境监测和保护、生物技术、军事领域、科学实验和过程控制中都起着重要作用,是实现先进过程控制,提高经济效益的关键之一。采用差压原理进行流量测量的流量计
图像在处理的过程中,由于成像系统、传输介质和存储设备等不完善,加之物体运动、噪声污染等原因,不可避免地会造成图像的失真和降质,因此在图像处理的相关领域建立图像质量评价机
本文对现代温室分层递阶控制系统进行了研究。本研究分别用机理法和测试法对温室进行了建模,得出温室对象具有纯滞后、大时间常数、增益非线性和强扰动的特性,又运用现代控制理