论文部分内容阅读
粗糙集理论是一种在不依赖主观经验的情况下,研究不精确、不确定知识的强有力数学工具,但在处理连续性数据问题方面能力有限。相比较而言,模糊集在处理连续性的数据方面明显优于粗糙集,却在模糊函数的生成问题上,太过于依赖专家以及个人的主观经验,从而在应用推广上也受到了一定程度的限制。相关专家综合了以上两者的优点,推出了模糊粗糙集。虽然模糊粗糙集在处理模糊型、连续型数据方面有自己的优势却在处理海量和增量式的数据流问题方面表现欠佳。F-模糊粗糙集理论在传统模糊粗糙集的基础上,将单表拓展到多表,并融入了并行约简的思想,能直接处理增量式的连续型数据,并为增量式或动态模糊决策表的属性约简提供了一种行而有效的方法。传统的决策语义是二支的,即正域、负域。而作为决策粗糙集核心思想之一的三支决策语义是三支的,即正域、负域和边界域。其将传统的决策语义扩展到了边界域上,对边界域决策给予充分的重视,将其看作一种符合人们日常做决定时思维习惯的具有可行性的决策。概念漂移是一种数据流中的数据随时间的推移而发生改变的现象。传统的概念漂移探测算法主要将研究对象集中在离散的数据或数据流上。这在处理现实中普遍存在的增量式的海量数据时就显得不足了。F-模糊粗糙集理论能直接处理增量式的连续型数据的特点正好弥补了传统研究在处理数据域上的不足。然而,在传统概念漂移探测的决策上,仅仅采用基于正域、负域的二支决策已经不能准确的刻画现实中概念的非精确性及分类的容错性。三支决策作为决策粗糙集的核心思想之一,它将边界域决策应用到传统的二支决策当中,即延迟决策,并认为边界域决策也是一类可行性决策。这符合人们在处理日常决策问题的思维习惯,具有广泛的代表性。本文首先将F-模糊粗糙集模型应用到概念漂移的探测中以探测模糊型数据流中的概念漂移。再将决策粗糙集中的三支决策语义应用到概念漂移的探测中,加强了探测的容错性。具体研究内容如下:1.基于F-模糊粗糙集的概念漂移探测。传统的粗糙集模型已经不能直接对连续型海量数据进行处理,也不能探测该数据流上的概念漂移现象。本文的研究建立在F-模糊粗糙集的基础之上,将其能够直接对连续型海量数据进行处理的特性应用到探测模糊型概念漂移中。该方法对处理现实生活中普遍存在的增量式模糊数据流具有指导意义,为探测模糊型数据流上的概念漂移现象提供了一种新的思路。2.基于三支决策的概念漂移探测。传统的包含正域、负域的二支决策语义已经不能准确刻画出人们在处理日常决策问题的思维模式。基于此,本文将决策粗糙集中三支决策的思想引入到概念漂移的探测中,在考虑概念在正域、负域上漂移情况的同时,也对其在边界域上的漂移情况给予充分重视。该方法比以往的概念漂移探测算法更具容错性,也更加符合人们日常生活中做决定时的思维习惯,具有广泛的代表性。本文主要的创新点如下:(1)将F-模糊粗糙集理论应用到传统的概念漂移研究中,拓展了概念漂移算法能够处理的数据域,即增量式海量数据。(2)将三支决策的思想应用到概念漂移探测中,使得更符合人类处理日常决策问题的思维模式,具有广泛的代表性。