基于强化学习的改进模糊C均值聚类算法研究及应用

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:ggg_0907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代技术发展越来越快,数据量剧增,例如在工业生产领域,多晶硅及碳碳复合材料生产过程中涉及到的生产因素比较多,会产生大量的生产数据。如何充分利用数据挖掘技术对上述数据进行分析以提高实际生产效率是本项目的研究重点。聚类算法是数据挖掘中一种重要的数据分析手段,模糊C均值算法(Fuzzy CMeans,FCM)作为软聚类算法,主要采用隶属度确定样本所述类簇。FCM主要缺陷是需要人工设定类簇数目及初始聚类中心,运算复杂度偏高、聚类结果易导致局部最优等。采用智能算法对其优化是近年研究趋势。强化学习是一种智能体与环境交互来获得反馈从而不断对全局解进行优化的算法,采用奖惩机制获得最优动作,常被用于游戏规划等。主要包括学习自动机、Q-Learning、Sarsa、Policy Gradient等算法,基于强化学习奖惩机制及全局优化能力对已有模型进行性能优化近年呈现增长趋势。为此,针对模糊聚类存在的缺点,利用强化学习的全局优化能力对模糊聚类算法进行改进,在迭代过程中通过奖惩机制对聚类效果不断调整,以提高算法的性能。本文工作主要包括以下几方面。模糊聚类算法FCM采用隶属度矩阵表征各样本隶属于每个类簇的程度,其初值及求解方式直接影响聚类性能。学习自动机作为一种强化学习算法,具有高效的自主学习能力,其运行在概率空间,具有良好的噪声鲁棒性以及全局调优能力等优点。为此,本文提出了一种基于学习自动机的模糊聚类算法(Fuzzy c-Means Based on Learning Automata,LAFCM),所提出算法将学习自动机的Q表映射为FCM算法隶属度矩阵,以利用学习自动机的自主学习能力更新各样本隶属度,充分考虑了聚类中心和新旧隶属度矩阵之间的关联,同时引入平均类内距离作为更新策略;利用学习自动机的奖惩机制,根据平均类内距离和目标函数变化对Q表及聚类中心进行更新。根据Q表各行最大值确定样本所属类簇。实验结果表明,LAFCM算法具有较好的聚类效果。LAFCM算法在聚类性能上有一定的提升,但是其在对目标函数进行求解时,未考虑上次迭代及当前目标函数值对下一次迭代性能产生的影响,使得在部分数据集上聚类效果较差。本文分析表明,该信息对聚类性能提升有显著影响。Q-Learning属于一种经典的强化学习算法,Q-Learning优点在于其寻找最终状态s的过程是一个反向优化的过程。在算法迭代过程当中,在每次迭代过程中将现在的结果与下一状态的预期结果进行误差比较。为此,本文进一步提出了基于Q-Learning的强化学习聚类算法(FCM algorithm based on Reinforcement Learning,RLFCM)。该算法引入了QLearning的梯度学习策略,并将其用于目标函数更新,将上次目标函数值与下次预估目标函数值的偏差考虑在内,以充分挖掘目标函数中有效信息,提高聚类性能。实验结果表明,与K-means、FCM、IEWLFCM、LAC四种算法相比,RLFCM算法在准确率等聚类性能指标上都有较好的提升。本文最后利用提出的LAFCM算法及RLFCM算法对多晶硅数据、碳碳复合材料生产数据进行分析,构建了工业生产数据聚类分析模型。实验结果表明,本文提出的聚类算法用于工业生产数据分析具有良好的聚类效果,可以用于企业实际生产中选取更优的生产方案,具有一定的实用价值。
其他文献
糖尿病已成为全球第一大慢性病,截止2021年,全世界糖尿病人数多达5.37亿。糖尿病最常见的并发症是糖尿病足,该症病变会伴随着足底神经、肌肉等组织功能失常,且与足底各区域压力、温度以及血氧饱和度的异常存在密切联系。为了预防和治疗糖尿病足,本研究根据该病发病机理,将材质柔软,压阻线性关系优秀的柔性压力传感阵列,体积小巧、高精度的红外温度和血氧传感融合于一个系统。本文基于STM32单片机,通过对采样电
学位
软骨组织自我修复能力非常有限,一旦受损,会导致损伤部位肿胀和疼痛,甚至引发更严重的炎症反应。特别是鼻软骨组织的损伤,尽管目前有很多方法可以实现修复,但翻修率超过15%,并且制备适应患者特异性的鼻软骨结构仍然是一个难题。3D生物打印技术可以根据患者损伤部位的图像数据,在计算机辅助下使用细胞和生物材料沉积来精确地制造复杂的个性化组织工程结构,为解决该问题带来了新的思路。生物材料的选择和支架的结构对于使
学位
随着经济发展,汽车已经逐渐成为了一种大众消费品,随着机动车辆的增加,伴随着的就是安全驾驶问题。造成交通事故的三大主要原因之一就是疲劳驾驶,疲劳驾驶会使得驾驶员降低反应能力,严重威胁自身和他人的生命健康。因此对驾驶员的疲劳进行实时监测很有必要性。目前大多数基于深度学习的疲劳驾驶检测方法在精度上虽然达到了一定的需求,但在速度上都还没有很高的实时性,无法在内存和计算能力有限的车载设备上应用。本文设计了一
学位
随着计算机算力的提升以及大规模数据集的应用,视觉目标跟踪算法在智能安防,流量监控,消防救灾和军事侦查等领域得到了广泛使用,特别是以孪生网络为基础的短期目标跟踪算法在精度,速度方面都取得了不错的效果,但是这类算法没有完善的模板更新机制,其使用的离线学习训练方式并未充分利用背景数据信息,在面对更接近实际场景的长期跟踪基准时跟踪精度和鲁棒性不足。因此,如何构建一种可以应对复杂场景中目标形变,频繁丢失与重
学位
在现代工业生产过程中,有许多关键变量与产品质量或生产效率密切相关,对关键变量进行及时监测对实现利润最大化、节能降耗具有重要意义。然而,由于测量环境恶劣、仪器成本高昂等原因,这些变量大多难以被及时有效地监测。但是通过软测量建模能够有效解决上述难题,近年来,软测量技术被应用在各个领域,且取得了非常好的效果。软测量建模通过采集与关键目标变量相关的过程变量作为输入,将关键变量作为输出,建立数学模型。根据过
学位
随着我国遥感技术的日益精进,越来越多搭载着多模式多用途传感器的对地观测卫星被成功发射进入太空,使我们获取到了多样化的地面观测数据,其中高分辨率光学遥感图像中包含了丰富的地物信息,在自然灾害检测、智慧城市建设、现代化军事战争等民用以及军事方面都得到了广泛应用。同时,关于高分辨率光学遥感图像目标检测的相关研究也引起了专家学者们的持续关注。虽然基于深度学习的目标检测算法在自然场景目标检测领域中已经取得了
学位
情感分析是自然语言处理领域的研究任务之一,狭义定义是对带有主观情感倾向的文本内容进行处理和推理。但由于多媒体技术的发展,互联网上的用户生成内容不再局限于文本,越来越多的图片和短视频数据涌现在各大平台。这些在线信息,尤其是评论信息中蕴含了人们的态度和情感倾向,借助多模态情感分析技术对其进行处理挖掘,能帮助产品或服务商评估产品性能和了解用户偏好,进而也促进互联网智能推荐技术发展。基于互联网评论形式多样
学位
癌症是一个全球性的公共问题,在所有消化道癌症病例中,直肠癌患者的发病率和死亡率均位列第一,危害着人类的生命健康。目前,磁共振成像技术可以为直肠癌患者提供更高的软组织对比度和无辐射影响,已成为应用最广泛、最有效的直肠癌检测方法。随着直肠癌早期筛查的普及,大多数直肠癌患者能够在早期发现并得到及时的治疗,明显提高了患者的生存率。在早期筛查中,放射科医生需要根据患者的医学影像特征,并结合丰富的临床经验进行
学位
中华鼢鼠是石桥林场所辖森林资源的重要危害之一,其主要吞噬树木的根系,严重影响着树木的成活率和保存率,以及生态建设的可持续性发展。中华鼢鼠给生态建设带来了无法估量的经济损失。本文就中华鼢鼠的生活习性、分布区域,侵害的树种做一探讨,并结合石桥林场这几年采取的有效防治办法,总结出了具有可操作性的防治措施。
期刊
身份识别在金融安全、安防等领域的重要性日益增加,而人脸识别由于其方便快捷、性价比高等优点在日程生活中得到了广泛的应用,也是近年来的研究热点之一。当今世界正在受到新冠肺炎疫情的冲击,人脸识别相较于指纹和身份证等身份识别方式,具有不需要接触特定传感器的特点,从而可以减少公共场所内的不必要接触,一定程度上减少了疫情传播的风险。由于新冠疫情的影响,佩戴口罩出行成为人们的生活准则,而口罩的遮挡使得采集到的人
学位