基于自编码网络的图像聚类研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qq237599512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是一种重要的无监督学习技术,其目的是将无标签数据分成几类或几组,广泛应用于计算机视觉、数据挖掘等领域。传统聚类算法对低维数据能够取得较好的效果,但对图像等高维、复杂、大规模数据集,传统方法存在计算成本高、易受冗余数据影响等问题,很难取得较好的效果。基于自编码网络(Auto Encoder,AE)的降维方法是目前用于聚类的主流方法,它通过构造结构良好的AE并与适当的聚类损失函数相结合,使得提取出来的低维特征具有聚类友好的性质,既降低了计算代价,又改善了聚类效果。本文设计了一个新的自编码网络结构,并结合自监督对比学习损失,给出一种新的基于自编码网络的聚类模型和算法。具体成果如下。本文首先对现有的单输入单输出自编码网络(Single Input Single Output Auto Encoder,SISOAE)结构进行改进,给出一个单输入多输出自编码网络(Single Input Multi Output Auto Encoder,SIMOAE)。SISOAE网络提取的图像特征语义单一,而SIMOAE提取的图像特征具有多样性的语义信息。在多个数据集上的实验结果表明,SIMOAE在两种聚类评估指标上显著优于SISOAE。其次,受对比学习的思想启发,提出一种对比聚类损失函数(Contrastive Clustering Loss,CCL),目的是使得相似的数据具有更好的聚集性,从而有利于聚类。实验结果表明,在SIMOAE网络中加入CCL能够明显提升聚类效果,相比于基准算法,本文算法在所有数据集上都具有更优的性能。
其他文献
重金属污染具有高毒性、持久性和生物积累性等特点,严重危害人体健康和生态安全。本论文以玉米芯残渣为原料,制备了一种碱改性生物炭-膨润土复合物(Ca O-Bent-CB),用于水中Pb2+的吸附去除和土壤中Pb2+的稳定化。同时,开发一种以丙烯酸-苯乙烯磺酸共聚物为液体固化剂、水泥为胶凝材料、纳米水化硅酸钙为早强剂的有机-无机复合底泥固化剂,用于底泥的固化及重金属的稳定化处理。主要研究内容如下:(1)
学位
我国城市化进程背景下人口向大中城市集聚趋势明显,城市空间扩张导致了职住分离现象,居民通勤距离拉长从而产生更多机动化出行需求。而小汽车出行方式的增多加重了城市交通系统负担,还造成了空气污染、能源消耗等各种负面效应,制约城市交通的可持续发展。在城市建设过程中,规划者开始考虑能否通过改善建成环境来促进居民出行方式调整,减少小汽车的使用。本文以环境行为学和效用最大化为理论基础,先是对建成环境概念进行了解释
学位
国内电商高速发展,淘宝、京东、拼多多等平台已逐渐取代了实体店铺,尤其随着新冠疫情的爆发,线上平台已成为人们购物的不二选择。随着购物需求的日益增多,如何将商品自动准确分类从而进一步精准推荐已成电商平台亟待解决的问题。服装相较于其他商品更具多样性,背景复杂、姿态各异、形变、视角、遮挡等因素都影响着其定位和分类的准确性,使服装分类任务成为一件具有挑战的任务。本文针对服装类别和服装风格分类问题展开研究,基
学位
随着我国高铁经济的快速发展,北京城区内高铁数量逐渐增多。京沪高铁对城市空间的割裂,导致沿线环境无序,地面空间闲置等问题突出。在城市交通空间的高质量发展下,城区内高铁沿线空间的再利用是治理的重要对象。北京行政辖区内京沪高铁共约41.88km,以高架形式为主,其桥下及沿线地面空间的再利用是本论文的研究内容。研究首先对城区内的京沪高铁沿线城市空间现状进行梳理,在遥感卫星图像的基础上,结合研究区内的实地调
学位
近年来,由于市场激烈竞争,企业采取并购方式进行规模扩张来扩大市场占有率越来越广泛。截至2021年12月,我国企业并购交易量达12790笔。然而实际并购中存在信息壁垒、对目标企业实际经营状况偏差等因素,引发收购目标企业估值不准确。于是对赌协议就应时而生运用于企业收购中,其事先约定相关条款和目标,便于控制因信息不对称和估值方法错误等因素产生的估值偏差风险、激励被并企业实现业绩目标、降低整合失败风险。但
学位
耕地作为粮食作物生长的载体,是保障粮食安全的基本要素。我国人多地少,人均耕地资源远低于世界平均水平,近年来由于城市化的加快以及社会经济的发展进一步导致了耕地数量的减少,粮食安全受到威胁,因此国家制定了严格的耕地保护制度对耕地的数量和质量进行保护。其中高标准农田建设可以巩固和提高粮食生产能力、保障国家粮食安全,高标准农田建设区的划定是高标准农田建设的首要工作,因此确定影响高标准农田建设条件的评价因子
学位
关系抽取是自然语言处理的基础任务,远程监督方法可以为关系抽取任务自动构建数据集,缓解人工构建数据集的压力和成本,为自动关系抽取的实现建立基础。然而其强假设的数据集构建方式造成错误标注的问题,引入大量噪声数据,导致较差的模型性能。因此为缓解远程监督中噪声数据问题,一方面从现有知识库引入实体背景描述信息来为模型提供更丰富的输入句子特征。另一方面采用对抗训练提高模型在遇到对抗样本时的鲁棒性。本文针对远程
学位
去芳构化反应是有机合成中的基本反应之一,它能够将芳香化合物转化为非芳香环状化合物。Birch还原反应是最常见的去芳构化反应之一,但是其往往需要使用碱金属和液氨等,而这些苛刻的反应条件限制了它的广泛使用。一个有意义的改进是,用氯硅烷作为亲电试剂,在普通溶剂中将芳环转化为硅取代环己烯或衍生物。该类反应所用试剂廉价且反应条件安全温和,但其适用范围仅限于结构简单的富电子芳烃。对于缺电子的芳基羰基化合物,在
学位
在新媒体迅猛发展的时代背景下,党媒也开启了平台化生产和传播模式,陆续入驻各大社交媒体平台以及其他新媒体平台。而在复杂的舆论环境下要想实现长足发展,必须在了解新媒体的平台属性以及受众需求的前提下积极争夺话语主导权,提升传播力和影响力。而运用情感传播策略能有效地增进受众的情感认同,从而达到有力的传播效果以助党媒“重夺麦克风”,基于此,党媒在新媒体平台开始摸索传播实践中的情感应用。本文选取《人民日报》微
学位
深度学习有着强大而有效的网络结构,可以高效地解决传统机器学习无法解决的复杂学习问题。得益于优秀的学习能力,深度神经网络广泛地应用于目标检测、图像分类、语音识别等领域,其中卷积神经网络在图像分类任务上的表现甚至超越了人类水平。然而近期的研究发现网络对于微小扰动有着很强的脆弱性,比如图像任务中的对抗样本,是一种人为构造的特征扰动,微小到人类几乎无法察觉,但会极大地干扰网络的正常决策与行为。除了精心构造
学位