论文部分内容阅读
模糊规则分类器能有效克服符号规则缺点,且更容易表达和理解,成为分类算法的研究热点。大数据环境下,丰富的数据源使得数据表达更为复杂含糊,高维、稀疏的数据加剧了模糊规则分类器存在“维度灾难”、效率和准确率不高等问题。论文借鉴确定规则多分类器(fuzzy classifers with fixed number of fuzzy rules,FCFFR)消除“维度灾难”的思想,提出限定模糊规则多分类器(fuzzy classifier with limited number of fuzzy rules,FCLFR)和限定模糊逆卷积分类模型(classifier model with limited number of fuzzy rules and inverse convolutional neural network,CMLFRICNN),以此充分发挥模糊规则的优势并规避其劣势。论文主要工作如下:1.针对现有模糊规则分类算法效率不高,建立模型时间长的问题,提出一种限定模糊规则多分类器模型。该分类器在正反规则的基础上增加基本规则,同时在模型训练过程中,成本函数最小化时模糊处理,以达到提高效率的目的。并与确定规则分类算法和其他主流分类模型进行了实验对比,验证了大数据集中限定规则模糊分类器模型提升了一些准确率,也较大地提升了效率。2.在1工作的基础上,进一步提出限定模糊逆卷积分类模型。该分类器模型有两个分支:限定模糊规则分支(limited fuzzy rules branch,LFRB)和限定模糊逆卷积分支(fuzzy inverse convolution branch,FICB)。使用基于模糊规则的简单特征选取算法(simple feature selection algorithm,SFS)将待分类样本分为主要特征集和次要特征集,主要特征集送入限定模糊逆卷积分支得到逆卷积分类结果,次要特征集送入限定模糊分支得到限定模糊规则分类结果,综合两个分支的结果得到最终分类结果。实验对比了限定模糊规则分类算法和其他主流分类模型,验证了限定模糊逆卷积分类模型的有效性。3.设计和实现了一个限定模糊逆卷积分类算法应用。该应用使用限定模糊逆卷积分类模型和XGBoost分类器对某电信企业即将流失的用户进行分类,得到各种原因流失用户。最后,对比两种算法性能,验证了限定模糊逆卷积分类器的性能。研究工作表明,基于模糊规则分类器,设计适用于大数据环境下的分类算法模型,可以提升模型的建立速度和效率,也可以提高分类算法的准确率,有较好的理论及实用意义。