论文部分内容阅读
本文以不完备信息系统为对象,以知识获取为目的,采用粗糙集、两步规则提取、区间集等理论方法研究了不完备信息系统知识获取理论与方法。主要内容如下:
1、研究了不完备信息系统基于联系度粗糙集模型的属性约简问题,提出了基于联系度的粗糙集模型中α同一度相容类约简、α同一度分布约简、α同一度分配约简、α同一度分配序约简、α同一度上下近似约简等概念,分析了各种协调集、各种约简之间的关系。
2、研究了基于联系度粗糙集的不完备信息系统知识获取方法。针对联系度阈值的选定问题,给出了一种确定联系度的客观方法,并通过研究联系度变化时对正域和对象邻域的影响,得出了联系度与知识粒度之间的关系,为进一步研究联系度粗糙集在知识获取方法中的应用提供了理论基础。
3、指出了前人利用分辨矩阵计算决策表核属性时出现的有关问题,讨论分析了这些问题产生的原因,在此基础上,给出了不同目标下约简的广义定义,提出了必要区分关系、非必要区分关系的概念,由此给出了一般意义下的分辨矩阵定义与求核方法。针对约简方法的问题,提出了属性0-1分辨矩阵概念以及不完备信息系统基于0-1矩阵的启发式属性约简算法。
4、研究不完备信息系统规则提取中的填充空值假设问题。通过实验来分析填充空值假设对于不完备信息系统规则提取的有效性。实验结果表明在填充空值未必能增加提取规则的信心值,很多情况下,不填充空值仅凭已知值即可以获得具有良好分类性能的规则。
5、提出一种新的规则表达方式和新的规则提取方法。在这种新的规则表达形式中,填充空值前获取的规则、可信度和填充空值后获取的规则、可信度同时保留在规则中,用户可以根据具体情况和规则的可信度自行选择,具有较大的灵活性与适应性。
6、针对不完备信息系统中的概念描述问题,研究基于区间集理论的描述方法,并给出了强规则与弱规则的提取方法。由于基于区间集理论的规则提取方法不考虑填充空值,因此消除了填充空值带来的数据失真问题。