大数据环境下基于模糊规则分类算法的研究及应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:s334794681
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊规则分类器能有效克服符号规则缺点,且更容易表达和理解,成为分类算法的研究热点。大数据环境下,丰富的数据源使得数据表达更为复杂含糊,高维、稀疏的数据加剧了模糊规则分类器存在“维度灾难”、效率和准确率不高等问题。论文借鉴确定规则多分类器(fuzzy classifers with fixed number of fuzzy rules,FCFFR)消除“维度灾难”的思想,提出限定模糊规则多分类器(fuzzy classifier with limited number of fuzzy rules,FCLFR)和限定模糊逆卷积分类模型(classifier model with limited number of fuzzy rules and inverse convolutional neural network,CMLFRICNN),以此充分发挥模糊规则的优势并规避其劣势。论文主要工作如下:1.针对现有模糊规则分类算法效率不高,建立模型时间长的问题,提出一种限定模糊规则多分类器模型。该分类器在正反规则的基础上增加基本规则,同时在模型训练过程中,成本函数最小化时模糊处理,以达到提高效率的目的。并与确定规则分类算法和其他主流分类模型进行了实验对比,验证了大数据集中限定规则模糊分类器模型提升了一些准确率,也较大地提升了效率。2.在1工作的基础上,进一步提出限定模糊逆卷积分类模型。该分类器模型有两个分支:限定模糊规则分支(limited fuzzy rules branch,LFRB)和限定模糊逆卷积分支(fuzzy inverse convolution branch,FICB)。使用基于模糊规则的简单特征选取算法(simple feature selection algorithm,SFS)将待分类样本分为主要特征集和次要特征集,主要特征集送入限定模糊逆卷积分支得到逆卷积分类结果,次要特征集送入限定模糊分支得到限定模糊规则分类结果,综合两个分支的结果得到最终分类结果。实验对比了限定模糊规则分类算法和其他主流分类模型,验证了限定模糊逆卷积分类模型的有效性。3.设计和实现了一个限定模糊逆卷积分类算法应用。该应用使用限定模糊逆卷积分类模型和XGBoost分类器对某电信企业即将流失的用户进行分类,得到各种原因流失用户。最后,对比两种算法性能,验证了限定模糊逆卷积分类器的性能。研究工作表明,基于模糊规则分类器,设计适用于大数据环境下的分类算法模型,可以提升模型的建立速度和效率,也可以提高分类算法的准确率,有较好的理论及实用意义。
其他文献
与传统计算机专业技能培训不同的是,信息安全专业技能的培训要求学员通过实际案例来进行培训和学习。为此,许多信息安全培训机构都在尝试建立相应的案例实训平台,以满足培训
在城市动态模拟研究中,如何构建基于机器学习算法或智能优化算法与元胞自动机的耦合模型,提高模型模拟的精度一直是学术界努力的方向。为了进一步厘清土地分类均衡性对土地模
研究目的:本研究通过对比初治及复治菌阳肺结核患者的一般情况、痰培养及药敏结果、影像学报告、有无糖尿病、高尿酸血症合并症及中医临床症状等要素,总结初治、复治肺结核患
一致性问题作为多智能体网络协调控制的基础,已广泛应用于机器人编队控制、无人驾驶飞行器、无人驾驶车辆、蜂拥控制、聚集以及同步等问题的研究中。除此之外,随着传感器网络
目的:应用三维能量多普勒超声技术(3D power doppler ultrasound,3D-PDU)和虚拟组织计算机辅助分析系统(virtual organ computer-aided analysis,VOCAL)对胎盘的三维能量多普
近年来,随着第五代移动通信系统(Fifth Generation Mobile Communication System,5G)的快速发展、人工智能(Artificial Intelligence,AI)技术的不断成熟以及工业产品的需求升级,工业制造需以工业物联网(Industrial Internet of Things,IIoT)技术为基础,将制造业向以智能制造为主导的“工业4.0”转型,旨在
近年来,生物特征识别技术由于其高可靠性和高有效性在用户身份认证领域受到了广泛关注。作为生物行为特征的一种,在线手写签名具有不易遗忘、采集方便且容易被人们接受等特点,在无纸化办公和电子商务等领域具有广阔的应用前景。但是由于手写签名的不稳定性,用户真实签名之间存在较大的类内差异,而真实签名和伪造签名之间的类间差异相对较小,使得在线手写签名认证研究具有一定的挑战性。本文以此为背景对在线手写签名认证算法进
现如今社会中几乎各个领域,每时每刻都会产生大量形态各异的流数据,这些数据产生的速度极快、数量极大,基本上无法被全部存储,因此对于日益增长的流数据而言,在线学习算法的
子宫内膜异位症(endometriosis,EMs)是一种常见的良性妇科疾病,以疼痛和不孕为主要特征,严重影响了生育时期女性的生活质量。近年来随着辅助生殖技术(assisted reproductive tec
研究背景及目的:布鲁氏杆菌是一种常见的人畜共患性细菌,是布鲁氏菌病的病原体,其不仅影响了畜牧业的发展,也危害了人类的生命健康。本研究以慢性布鲁氏菌病患者为研究对象,