论文部分内容阅读
本文的研究目标就是从数据集合中挖掘出基于距离的例外集合。
首先,对传统例外算法做了研究,根据需要挖掘的实际数据的情况,我们选择了基于距离的例外挖掘方法。提出了改进的基于距离的例外定义即:Dkn例外定义。根据此定义我们可以发现全局性的例外,也可发现局部性的例外。
其次,在挖掘例外的计算过程中,考虑了多种数据类型及其混合类型的情况,使计算能够适用于多种情况。同时,吸取了传统例外挖掘算法的精华,考虑类及其最邻近类的关系以及类内部数据对象间的关系,从而使计算更符合实际情况。
最后,提出相应的例外挖掘算法并在合成数据上实验验证了算法的正确性和有效性之后,在学校教师评价数据库的数据中进行了例外挖掘。