学习向量量化聚类算法优化研究及其应用

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:wangwenhu8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,各行业智能信息采集系统已广泛普及,由此产生的数据资源呈现爆发式增长。如何有效利用这些数据来分析和挖掘工业生产数据、医疗病历数据等行业数据分布规律,为工业生产或医疗辅助诊断等提供可供借鉴的指导作用。聚类算法是数据挖掘领域一种重要的数据分析方法,多数聚类算法采用无监督学习方式,不同于这些经典聚类算法,LVQ(Learning vector quantization)算法是一种需要数据标签信息的聚类算法,因此其不属于无监督聚类算法。LVQ算法优点是理论机理简单,在处理低维数据时具有较好的聚类效果,但其存在“局部最优解”现象,且随着数据维度增大,计算量随之增大,但聚类效果呈现下降趋势等缺陷,如何有效提高其聚类性能,是本文重点研究内容。深度强化学习作为一种将深度学习与强化学习结合的算法,充分利用了深度学习较强的感知能力,以及强化学习的决策能力。被广泛应用于电力调度、路径规划、智能控制、推荐系统、游戏等诸多领域。采用深度强化学习较强自主学习能力对LVQ算法进行优化,有助于提升其聚类性能。本文主要工作如下。首先,为了解决传统聚类算法对于高维数据聚类效果较差的问题,运用深度学习中的SAE(稀疏自编码,Sparse Auto Encoder)对原始数据进行降维,给出了结合三层稀疏自编码降维的LVQ聚类算法(Deep Learning Clustering,DLC)。将SAE中的隐藏层设为三层,通过SAE降维后的数据运用于LVQ算法。实验结果表明,基于降维后的数据,LVQ算法聚类性能更优。其次,影响聚类性能的重要因素除了数据本身分布特性及其维度大小等,聚类算法本身实现机理是更重要影响因素。LVQ算法在聚类过程中,原型向量需与数据集中每一个样本点做“拉近”或“远离”运算,但和其中有些样本点的这种运算是不必要的,如何筛选有意义的运算样本以提高聚类效率,有必要探究。为此,本文进一步基于深度强化学习算法对LVQ聚类算法进行优化,提出了基于深度强化学习优化的聚类算法(DQN-LVQ)。首先对原始数据集采用三层SAE算法进行降维处理,然后将LVQ算法的每一次迭代看做深度强化学习的一个状态,LVQ算法初始化一组原型向量后,用原型向量与数据集中每一个数据点做“拉近”或“远离”运算来完成初次迭代。进而,依据“探索”和“利用”机制,DQN-LVQ算法仅挑选一部分数据点与原型向量做运算,并把这一过程视为强化学习智能体的一个动作;数据子集选取的不同,产生的动作也不同;将这些动作组成智能体动作集,选定动作后,根据奖赏函数找到最佳动作,进入下一状态。用于公共数据集仿真结果表明,改进后的算法聚类性能更优。论文最后将上述聚类算法进一步用于工业生产数据及医疗数据分析,以验证算法性能。工业生产领域,多晶硅以及碳碳沉积材料生产工艺复杂,工序繁多,其产品质量受多种因素共同影响。工业界常使用物理和化学等传统方法对多晶硅生产流程和原料的化学成分进行分析以提高产品的质量。多晶硅以及碳碳沉积材料实际生产过程中原料种类和配比方案复杂多样,使用传统的分析方法难以从中找出成本低廉,经济效益较高的原料配比方案。将聚类算法用于二者生产数据分析,结果表明,其对提高多晶硅实际生产过程中原料配比方案选择效率、挖掘高效的碳碳沉积材料生产数据具有一定效果。脑卒俗称“脑中风”,是常见的具有极大危害,造成严重后果的脑部疾病,具有极高的死亡率。对脑卒中患者数据进行聚类分析,有助于分析卒中患者数据分布规律,挖掘脑卒中发病风险关键因素。本文提出的聚类算法应用于脑卒中患者病历数据分析表明,所提出算法具有较好聚类效果,对将其未来用于辅助临床医生分析病历数据,挖掘数据潜在分布规律,具有一定参考价值。
其他文献
曲轴是发动机中承担冲击负荷并传递动力的重要零部件,在柴油机整机使用过程中,曲轴还承担着复杂的交变载荷和扭转负荷。曲轴的稳定性极大限度地限制了整机的安全性和寿命,曲轴在发动机上承受了很大的压力和全部动力,在运行过程中,曲轴因惯性力和离心力的复杂作用而承担着非常大的复杂应力,轴径表面要承担高速、长时的摩擦磨损,最为薄弱的属圆角过渡位置,主轴颈的圆角位置最为严重。高速工作的柴油机曲轴情况更加恶劣,曲轴必
学位
由于互联网和相关数据驱动应用的爆炸性增长,使低成本、高速率光纤通信系统的需求大幅提升,集成电吸收调制激光器(EML)作为光纤通讯的首选光源也成为当前的研究热点。在EML的制造技术中,选择区域外延生长叠层双有源区(SAG-DSAL)技术集成了对接生长技术、选择区域外延技术和双有源区叠层技术的优点,具有非常好的发展前景。本文对基于SAG-DSAL结构的电吸收调制激光器(SAG-DSAL-EML)进行相
学位
随着国内航空航天、导航、核能等高新技术的快速发展,对材料的要求也越来越高,碳/碳复合材料作为一种新型复合材料,由于其自身较好的物理性能和力学性能而得到广泛应用。目前国内外绝大多数的研究主要针对致密技术进行实验与分析,沉积质量作为致密效果的重要指标之一,受到极大的关注。随着沉积数据的积累和实际生产的需要,依靠人力分析已经无法满足设备生产需求,如何充分利用沉积数据有效地开展碳/碳复合材料沉积质量的预测
学位
对于图像情绪识别研究而言,图像情绪数据是进行情绪识别研究的基础,良好充足的图像情绪数据可以降低噪声的影响,提取到更优的特征,图像情绪数据不足会影响情绪识别结果;图像情绪识别算法是进行情绪识别研究的工具,帮助达到提取特征、情绪分类的目的,高效可靠的情绪识别算法可以得到更快更优的情绪识别结果。对于传统的图像数据扩展算法而言,算法思维有一定的局限性,例如只对图像数据进行图像增强扩展或者只进行虚拟图像生成
学位
人民防空作为国防建设的组成部分,是保护人民生命和财产安全的重要力量。随着人防工程建设规模的大幅度增加,特别是和平时期的非规范化使用,使得战时人防疏散难以有序、协调、安全的组织疏散,无法适应未来的信息化战争。同时在人员疏散过程中由于人群过于密集极易引发窒息、踩踏等二次灾难。基于深度学习的人流量统计技术可以实现人群掩蔽过程中可靠、精准的监控及帮助指挥人员实施安全、有效的疏散。人流量统计的关键就是行人检
学位
光热疗法(PTT)被广泛认为是一种可避免损伤正常组织而达到理想疗效水平的微创治疗策略。PTT的核心在于具有高质量光热转换的光敏剂。高效的光热转换材料应在近红外(NIR)范围内表现出强吸收性、高光热转换效率和高生物安全性。目前,光热转换材料的范畴涵盖了贵金属基纳米材料、金属与非金属化合物及传统有机染料。但贵金属基纳米材料高昂的生产成本和不良的生物相容性,金属和非金属化合物的不可降解性,以及传统有机染
学位
近年来随着无人机技术的不断发展与完善,基于无人机平台的航拍目标检测也越来越受到广大研究者的关注。航拍目标检测不仅能在无人机侦察、导弹制导等军事领域得到应用,而且在交通监控、行人、车流检测、城市规划等民用领域也大放异彩。相对于普通目标检测任务来说,航拍图像的目标检测任务具有目标重叠、目标遮挡、大量小目标、疏密不一、易受天气影响等难点,尤其是小目标检测在目标检测领域一直是一大难点。当前针对航拍图像的目
学位
卟啉化合物具有较大的π-电子共轭系统,结构和功能多样,是一种很有潜力的可用于光限幅的材料。然而目前对于卟啉化合物光限幅特性的研究主要集中在近红外波段,可见光波段的研究相对较少。基于此,本论文针对卟啉化合物在可见光波段的非线性光学和光限幅特性做了以下工作:(1)研究了不同外围取代基自由卟啉在可见光波段的非线性光学特性。使用空间自相位调制(Spatial Self-phase Modulation,S
学位
随着社会的发展,出现了越来越多基于三维地形可视化的应用需求,大规模三维地形实时绘制一直是人们关注的热点。在虚拟现实、计算机仿真、军事战争等领域,地形的实时动态绘制发挥着越来越重要的作用。本文的主要研发目标为,全面提升三维大场景的描绘效果,尤其面向于大型二三维地形场景的描绘,并提供自己的解决方案与实现方式,以有效减少系统内存的浪费,并合理管控和调配场景数据,以提升大规模地形描绘的效率和品质。首先,本
学位
受石墨烯优异性能的启发,研究者们也开始研究类似石墨烯结构的其他二维纳米材料的气敏性能,其中以过度金属硫化物(TMDs)为主。二硫化钼(MoS2)是备受研究人员关注的二维过渡金属硫化物之一,由于其大的直接带隙(1.2-1.9 e V)、高的表面积-体积比和出色的场效应晶体管效应而受到越来越多的关注。由于层状MoS2拥有大的表面-体积比、高的承载迁移率和较多活性点,使其成为非常有前景的气体检测材料。氧
学位