基于多信息特征融合的聚类算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:blyd831104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是机器学习中的一个重要研究方向。当前正处于信息爆炸的时代,样本数据可以通过互联网、社交媒体、公开募集等多种方法便利地获得,然而对原始数据的打标过程却非常耗时耗力。因此,对原始数据首先进行聚类处理成为了更好的选择,同时也为后续的打标、识别、分类等等算法的性能提升奠定基础。人脸识别已经经过了多年的发展与进步,在学术界以及产业界都有了非常好的应用效果。然而当前人脸识别仍然存在一定的挑战,例如在不同的光源、阴影、表情、遮罩以及噪声污染下的样本中对人脸特征的识别、提取以及相似度估算等等。传统的聚类算法往往基于研究对象的单一信息特征,容易陷入盲人摸象、管中窥豹的局部认知之中。引入多信息特征的融合学习模型能够综合更多维度的信息,得到对研究对象的更为全面的认知,进而提升聚类算法的性能。本文主要研究目标为基于人脸的多信息特征的融合聚类模型,旨在提出一种新的跨学科的信息特征提取技术,并将新的信息特征与数据本身的多种信息特征进行融合,最终提出新的高效可行的机器学习融合聚类算法模型。根据人类的认知直觉,对于不同对象的人脸是基于其面部轮廓、皮肤纹理等信息进行区分的,这些对于区分人脸而言的高价值信息,主要存在于人脸图像中像素变化剧烈的区域。图像的无价值信息如随机噪声、无用成分以及光影、遮罩等干扰噪声在原始空间域中难以分离,而在频域中能更为方便地进行捕获及分离。基于此分析,在本文中,将图像样本从原始的二维空间域转换至频域中,并通过信号处理的相关技术对高价值的信息进行提取,同时捕获并筛除无用的干扰信息,以提取一种新的图像信息特征“高频纹理分量”(High-Frequency Texture Component,HFTC)。通过将高频纹理分量信息与数据空间流形信息进行融合,提出了一种新的融合谱聚类算法模型——高频谱聚类(High-Frequency Spectral Clustering,HFSC)。具体而言,在HFSC中首先提取所有样本点的高频纹理分量信息,根据高频纹理分量信息特征提出一种新的距离估算方式以计算样本点间的相似度,并基于此相似度,构造数据的空间流形图结构。在该图结构的基础上使用传统谱聚类,以求得最终的聚类簇标签信息。根据在真实人脸数据集上的实验可得,高频纹理分量与空间流形信息融合谱聚类算法HFSC具有易实现、高效率以及高精度的优点。为了进一步地将信息特征融合理论应用于产业落地,本文中基于HFSC算法框架的特点,设计了一种集成电路低质量图像处理应用方案。该方案可以对低质量的芯片电镜扫描图进行切分、定位、特征提取以及聚类,为后续缺陷、硬件木马检测等验证过程提供良好的数据支撑。在基于真实电镜扫描图生成的仿真数据集上进行实验,结果表明HFSC算法具有高运行效率、高准确率以及高鲁棒性等优点,拥有非常好的应用落地价值。通过将高频纹理分量信息与数据的低秩信息进行融合,提出了一种新的人脸数据混合表示——高频低秩表示(High-Frequency Low-Rank Representation,HFLRR)。该表示通过一个统一的最优化问题框架来融合原始数据的低秩信息以及数据的高频纹理分量信息特征,在迭代求解的过程中,找到融合了二者的最优数据表示。具体而言,在HFLRR中同时对数据的低秩性、数据的稀疏噪声以及数据表示与高频纹理分量矩阵的差异性进行非线性规划建模,并通过交替优化的方式进行最优值求解。将HFLRR所学习得到的混合表示应用在真实人脸数据集上进行子空间聚类,聚类实验结果表示,融合了高频纹理信息的低秩子空间表示拥有更好的运算效率与算法性能。接下来,为了进一步探究人脸图像数据在频域中的本质特征,发掘高频纹理分量信息特征的机理,提出了一种基于高频纹理分量与低秩约束融合的子空间结构恢复算法框架——频域低秩子空间恢复(Frequency domain Low-Rank Subspace Recovery,FLRSR)。由于数据在频域中能够更有效地筛除次要信息、噪声干扰并且提取高价值信息,因此认为数据的频域信号相较于原始域中拥有更好的低秩属性以及更接近真实的子空间结构。因此,分别设计实验来证明高频纹理信息优秀的低秩特征以及探索其影响因素。并最终提出了基于数据频域低秩属性的子空间结构恢复算法。在真实人脸数据集的实验中表明,基于数据频域的低秩子空间相较于原始域有更好的块对角结构以及更优秀的聚类性能。
其他文献
科技成果转化是科技创新实现经济效益的重要手段。央企拥有丰富的创新成果,是国有经济发挥主导作用的骨干力量,推动央企科技成果转化具有重要意义。政策文本分析和问卷调查结果表明,我国“鼓励、支持、奖励”央企开展科技成果转化,但央企科技成果作为国有资产,还必须遵循国有资产管理的“强监督、防流失、增值保值”等相关原则。通过建立央企科技成果转化与国有资产管理耦合模型,系统分析央企科技成果转化全流程中的制度困境,
新课程改革以后,英语写作变得越来越重要。义务教育英语课程标准中对英语写作部分也提出具体要求。小学生对新鲜事物充满好奇和兴趣,对外界刺激反应强烈,同时小学生注意力保持时间短,意志不够坚定,并且容易受外界因素影响,发展小学生学习兴趣可以提高他们学习的积极性,延长学生注意力保持的时间。小学生心理发展规律和学习特点的特殊性,使得小学英语写作兴趣培养变得尤为重要。本文主要围绕两个问题进行开展:(1)小学高年
采用交错控制的三电平Buck变换器不仅降低了功率开关管的电压应力,同时减小了输出滤波器的大小,在大功率电力电子变换器系统中具有广泛的应用前景。交错控制三电平Buck变换器受功率开关器件寄生参数的影响,输出电压纹波及电感电流纹波不仅发生了畸变,且纹波电压大小和忽略寄生参数的纹波电压存在较大误差。本文深入分析了交错控制三电平Buck变换器输出纹波电压畸变机理,建立了考虑功率开关器件寄生参数的电感电流纹
关于中国农村留守儿童的大量研究表明学习成绩最差的不是父母均外出的留守儿童,而是父亲在家、母亲外出(以下简称仅母外出)的留守儿童。主导观念认为这是“养不教,父之过”的反映,但基于后天形塑论的理论视角不能在实证层面完整解释此现象。基于经验观察,结合基因社会学的理论逻辑,认为这一现象应是此类留守儿童在健康状况、认知能力、非认知能力三类个体特质上的先天性不足导致的。本文通过逐步线性回归分析中国教育追踪调查
本文采用同位素和水化学分析的方法对鹤庆西山地区岩溶地下水循环特征进行了分析。根据区内水文地质边界条件,将研究区划分为5个岩溶水系统。利用氢氧同位素的分析结果,建立地表水与地下水的δD-δ18O关系曲线,分析地下水与地表水体的相互关系,并结合水化学分析方法对岩溶地下水水化学特征与地层岩性的关系进行了研究。结果表明,研究区地表水与地下水联系紧密,大气降水通过鹤庆西山地区地表岩溶洼地等补给地下水,区内地
施特劳斯通过揭示隐藏在西方古典政治哲学传统中显白教诲与隐微教诲的写作方式问题,展开了对古典哲人及其哲学的双重理解和深入阐释,并将此视为理解古典哲人和阅读古典哲学的重要原则。参考并借鉴其隐显二重说的解经原则来理解孔子与《论语》,在于提供一种比较视域下的观照与反思,重新审视在中国的学术传统下,何以只有一种显白教诲的孔子及其学说,在后世被不断而又不可避免地以隐微教诲的方式予以解读和阐释。同时指出,只有回
在对外汉语教学中,综合课是一门核心课程,是学生学习汉语知识、提高语言交际能力以及了解中国文化的重要途径。本文以支架式教学法为指导,对《汉语教程》中《我的眼镜儿摔坏了》进行教学设计,目的是提高学生的自主学习能力和汉语的综合应用能力,并且为支架式教学法在对外汉语综合课中的实践运用提供一些参考。本文在对支架式教学法进行概述的基础上,分析支架式教学法的适用性以及主要优势。之后,从教学设计的相关要素准备、支
<正>湖北红日子富硒蔬菜种植专业合作社自2014年10月成立以来,本着"互惠互利、共同发展"的原则,坚持创新、协调、绿色、开放、共享的发展理念,积极探索合作社发展的新路径。近年来,合作社立足农村、服务农业、心系农民,创新利益联结机制,多措并举聚合力,形成了农民收入增加、社会效益提升、
期刊
2013年10月,永续债开始进入我国资本市场,这源于武汉地铁集团成功实现永续债在内地债券市场的首单发行。自2015年以来,在国内“降杠杆”政策的推动和投资者的的逐步认可下,永续债在我国境内的发行数量和发行规模均实现飞跃。越来越多的国有企业开始关注到永续债这一兼具双重优势的创新型金融工具,特别是高杠杆的国有建筑类企业更是产生极大依赖。根据Wind数据库显示,2020年永续债年度发行金额已逼近1.66