论文部分内容阅读
粗糙集理论(Rough Set,RS)是一种刻画不完整、不确定知识的数学工具.对于不确定性数据的描述,其运用上下近似集的概念来描述.粗糙集理论中知识的不确定性主要是由两个原因引起的:一个原因是直接来自于论域上的二元关系及其产生的知识模块,即近似空间本身.如果二元关系产生的每一个等价类中只有一个元素,那么等价关系产生的划分不含有任何信息;划分越粗,每一个知识模块越大,知识库中的知识越粗糙,相对于近似空间的概念,知识就越不确定,这种不确定性称为概念的不确定性.处理概念不确定性的方法往往采用信息熵来刻画,知识的粗糙性与信息熵的关系比较密切,知识的粗糙性实质上是其所含信息多少的更深层次的刻画.引起粗糙集理论知识不确定性的另一个原因来自于在给定的近似空间的粗糙集的边界,当边界为空集时知识是完全确定的,边界越大知识就越粗糙或越模糊,这种不确定称为系统的不确定性.粗糙集理论度量知识的这类不确定性是通过引进粗糙性测度或近似精度来实现的.基于粗糙集产生了粗糙集分析方法,它能有效的分析和处理不完整、不精确、不确定、不一致等各种不完备信息,并从中发现各种隐含知识,揭示潜在的规律.粗糙集分析方法是新兴的一种数据分析方法.经典的Pawlak粗糙集是一个静态的粗糙集,对于处理动态问题无能为力,然而现实中各种信息系统(如金融系统、风险投资系统、医疗诊断系统等)多为动态的,尤其对于具有风险性的决策系统,决策者面对外在风险的不断变化,需要对决策进行调整,以期使公司的收益最大或损失最小,所以作为公司的决策者,需要对公司所面临的情况有所预测并及早对其进行必要的风险控制.这需要决策者时刻关注外在风险的变化情况,以便作出对公司最有利的决策.S-粗集拓展了Pawlak粗糙集,其借助元素迁移来表达系统的动态性.元素迁移是S-粗集理论中最基本最重要的概念之一.如果发生元素迁移,其可能影响到粗糙集边界,即将影响到粗糙集理论中对知识不确定的度量值.事实上,在动态系统中,元素迁移是否发生往往是不确定的,呈现出一定的随机性,目前关于S-粗集的理论研究均是基于元素迁移既成事实上,而对于迁移所表现出来的随机性的相关研究甚少.所以有必要对元素迁移的可能性进行度量,针对元素迁移的随机特性进行研究,充分挖掘迁移所导致的信息系统中统计信息的变化,从概率统计的角度考虑外在因素的影响,借助概率统计的来度量外在因素的影响.本文在总结前人工作的基础上主要作了以下工作:1.在保持不确定近似空间信息熵不变的情况下,给出了相对最小属性约简的算法;给出元素干扰概率(置信度)的定义,并对其概率特征进行了初步研究;在此基础上,将S-粗集与概率粗糙集模型结合,给出了概率型S_p-粗集的数学结构表达式.探讨了概率型S_p-粗集与S-粗集、概率型粗糙集的关系.2.对元素干扰进一步研究,给出元素干扰??-状态转移概率,??-转移矩阵,干扰因素??-正(逆)向可分解以及干扰因素??-完全可分解等概念,并对其性质进行初步研究.将Bayes决策粗糙集模型与S_p-粗集结合,提出了Bayes决策的S_p-粗集模型,Bayes决策的S_p-粗集精算模型,分别给出了这两个Bayes决策模型的基本过程,同时对这些模型间的关系做了简单的论述.