论文部分内容阅读
经典粗糙集理论是建立在等价关系上,假设每个样本对象拥有确定的属性值,但在实际的数据挖掘问题中,因为各种因素的影响,待处理的数据常常是不完备的,这些不完备数据将会影响之后的数据分析。因此,从不完备信息系统中应用粗糙集理论获取知识,已成为目前重要的研究课题之一。对于不完备信息系统,已有许多相关学者将优势关系粗糙集理论在其中进行了扩充。本文就是针对不完备信息系统中各种扩展优势关系粗糙集进行深入研究。首先对现有的优势关系粗糙集模型进行对比分析,发现这些模型仍旧存在一些不足之处:当系统中同一属性的两个对象属性值均为空值,或者其属性值一个为空值另一个为中间值的情况(这时的属性称为不可比属性)出现时,现有的优势关系粗糙集采取不予考虑直接排除的方式,但若是上述情况频繁发生,采用现有优势关系粗糙集做决策,得到的决策结果将会与实际结果有很大的偏差。针对上述问题,本文引入临界值的概念,将不完备信息系统以不可比属性量的多少分为两种情况进行讨论:第一种情况,在临界值大于或等于基础临界值条件下,保留限制优势关系的优点,构建改进的限制优势关系粗糙集决策模型,并基于改进的限制优势关系给出属性约简方法,提取决策规则,进而形成基于改进的限制优势关系粗糙集的决策方法;第二种情况,在临界值小于基础临界值条件下,利用属性值为区间数的成对比较表,结合优势关系和可变精度粗糙集的扩展理论构建基于优势关系和可变精度粗糙集模型,给出约简方法并提取决策规则,设定规则置信度的阈值为可变精度粗糙集(VPRS)的可变参数值,得到基于优势关系和可变精度粗糙集的决策方法。分情况讨论的决策方法,保留了现有优势关系粗糙集的优点,解决了不完备信息系统中的大量不可比属性处理不善对决策结果产生重要影响这一问题。最后以深圳市政府采购部供应商选择为例,验证本文方法的实用性。