图像检索中语义一致性映射的哈希编码表示

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：wjs9988

【摘要】

：

【作者】

：

金声

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

哈希算法作为经典的近似最近邻算法,凭借效率上的优势,在大数据时代吸引了大量研究者的目光。近期,现有的哈希算法利用深度神经网络的表达能力,通过大量的监督数据训练模型,构建了准确的哈希映射。然而对大量监督数据的强烈依赖限制了深度哈希算法的进一步落地。据此本文在标签数据不足的情况下,研究语义一致性映射的哈希编码表示。本文的研究对于哈希算法的现实应用有着重要的意义。在对相关研究进行分析后发现,现有的哈希编码算法主要存在三个问题:第一,图像语义一致性难以映射到编码空间。第二,图像语义一致性映射到编码空间的准确性不足。复杂的背景,样本不均衡等干扰因素均会导致映射错误。第三,图像语义一致性映射到编码空间的准确性在动态环境中难以维持。本文针对分析中的上述问题,分别给出相应的解决方案。具体地,本文的研究内容和主要贡献包括以下四个方面:首先,为了使图像语义一致性映射到编码空间,本文基于语义一致性映射原则,提出均衡离散哈希算法。所提算法通过编码层和特征层的语义关系一致构建哈希映射。具体而言,均衡离散哈希采用图结构建立特征层的语义关系模型。其中将特征间的分离程度引入边的定义,编码作为图的结点。紧接着,本文提出正交时序一致性损失。该损失项在降低编码冗余程度的同时,通过自监督方式对哈希映射进行进一步修正。最后,本文采用离散循环坐标下降法求解目标问题,避免了量化过程中的语义损失。实验证明所提算法在不依赖标签信息情况下,在类别语义和编码之间建立映射。其次,为了使更加细粒度的图像语义一致性映射到编码空间,本文结合语义判别性映射原则,提出局部判别哈希算法。语义判别性映射原则要求映射使不同类的样本点尽量分离,同类的尽量紧凑。局部判别哈希利用少量的标签样本,要求哈希映射聚焦在样本的局部语义区域,以此增加编码的类内聚合程度,从而构建哈希映射。所提算法包括语义挖掘模型和哈希模型。其中,哈希模型被用于监督判别性挖掘。具体而言,本文提出一种基于四元组的判别性损失,要求经过判别性处理后的样本映射到区分度更高的哈希编码。实验结果证明,所提出的算法能够在细粒度类别的语义和编码之间建立映射。再次,为了提升图像语义一致性映射到编码空间的准确性,本文提出语义映射自步拓展的对抗生成哈希算法。所提算法仿造人类的学习过程,根据映射与语义的一致性程度,逐步提升对困难样本的映射准确性。困难样本指的是难以编码的样本,源于样本语义区域丢失,以及样本不均衡问题,即部分样本由于数量不足,在训练过程中被忽视。为此,自步对抗生成哈希联合学习困难样本生成模型和哈希模型。根据哈希模型的需求,针对性生成合适的困难样本。首先,本文设计了高效的生成模型,分别从遮挡和形变上生成困难样本。紧接着,本文提出基于自步学习的生成策略,从易到难得控制困难样本的生成。除此之外,本文提出语义一致性损失,挖掘无监督样本的语义信息,提高哈希映射的准确性。实验证明,所提算法能够建立更加准确和鲁棒的哈希映射。最后,为了在动态环境中维持图像语义一致性映射到编码空间的准确性,本文提出语义一致性映射实时调整的中心自适应哈希算法。算法流程包括两个阶段:对新增类别自适应的构建类别中心,之后哈希模型将样本拟合到指定的类别中心。首先,本文利用酉矩阵的标准正交性构建区分度足够大的类别中心。其次,为了保留对旧样本语义的记忆,本文构建一种基于全局语义知识的蒸馏学习框架。并通过不同步更新的策略缓解灾难性遗忘的问题。最后,对于新输入样本,本文提出一种比特层面的注意力损失,以概率密度作为样本的权值,使模型实时聚焦到拟合不好的样本。实验证明,所提算法在动态的在线环境中,能够实时调整映射,以维持准确性。通过上述研究,本文对图像检索中语义一致性映射的哈希算法,进行了深入地探索,并为其中存在的关键问题提供了切实有效的解决方案,并对算法的在线应用进行了针对性的改进和创新。本文所提算法对于哈希算法的实际应用有着重要的研究意义。

其他文献

基于语义单调约束语音-文本软对齐的端到端语音识别

语音识别是人工智能领域的重要研究方向之一,它能将语音信号转化为对应的文本序列。目前关于语音识别的研究主要集中在基于深度学习的端到端技术上。深度学习模型通常需要等长的输入输出单元,但由于单个文本单元往往对应着连续多个语音帧,导致它们的序列长度不一致,因此,学习语音和文本序列间的对齐关系是端到端语音识别需要解决的关键问题之一。根据是否需要学习帧级的对齐关系,端到端语音识别技术可分为混合对齐型和软对齐型

学位

动态信息网中个体、社团及之间关系分析研究

信息网,表示了真实世界中众多的对象以及对象之间的联系,在多种现实应用中广泛存在。对信息网的分析研究具有重要的实际意义和广阔的应用前景。在实际中,信息网上的对象和联系常常随着时间的推移不断发生变化,这样的信息网称为动态信息网。近年来,动态信息网中个体、社团及之间关系的分析工作已经取得了一些研究进展,并被广泛应用于实际。但是,相关研究仍然面临着很多挑战。第一,动态信息网中尚有很多重要而有趣的个体、社团

学位

小孔节流动静压混合式浮动环动力学及密封特性研究

浮动环密封是一种典型的径向间隙密封,其工作原理是在密封界面上形成一层极薄的流体膜,利用流体承载效应使浮动环与转子脱离接触,利用微小间隙的流阻效应实现对介质的密封。近年来随着大推力、可重复使用火箭和大型多功能复合离心机的发展,对浮动环密封寿命、可靠性和变工况适应能力等提出了挑战。本文根据高压、高速、变工况、可重复使用动密封工程应用需求,提出一种小孔节流动静压混合式浮动环密封（以下简称HFRS）。核心

学位

面向协作SLAM的多机器人系统学习方法研究

协作同时定位与建图（Simultaneous Localization and Mapping,SLAM）是指多个机器人在未知环境中通过协作,实现同时定位与环境地图创建的技术。协作SLAM被广泛应用于大规模环境建图,但是对系统总体协调效率以及机器人个体之间的协作能力要求非常高。因此,将多机器人系统学习方法应用于协作SLAM成为近年来的研究热点。但是现有方法存在着学习目的及方法单一,无法解决多机器人

学位

霍尔推力器羽流模拟方法及羽流特性研究

霍尔推力器是一种具有高效率、高比冲、长寿命等优点的电推进装置。霍尔推力器在工作过程中,其尾部会形成等离子体羽流。由于羽流中包含了大量的带电粒子,其在空间中的扩散会影响航天器所处的电磁场环境,同时产生的高能离子会打到航天器表面,对航天器表面造成力矩、热沉积、侵蚀等影响。因此,有必要对霍尔推力器羽流进行系统的研究工作。针对霍尔推力器的羽流研究主要包括地面试验、在轨试验和数值模拟三种手段。地面试验测量受

学位

基于比对骨架的第三代测序数据比对与变异检测方法研究

近年来,随着高通量测序技术的快速发展和国际大规模人类基因组计划的广泛实施,产生了EB至ZB量级亟待分析解读的大规模基因组数据。这些数据是新时代生命科学、人口健康、生物安全等战略性领域发展的基础,蕴含巨大的科学、社会和经济价值。序列比对和变异检测是基因组数据分析中的核心技术环节,对于基因表达量分析、选择性剪接、解析基因组中蕴含的遗传与变异信息、发现与疾病和表型的关联关系、揭示疾病发生与发展的分子机制

学位

多病理阶段心肌缺血的多尺度建模与药物作用机制的研究

心脏正常起搏功能的维持依赖于冠状动脉源源不断的血液供给。当冠状动脉因粥样硬化出现狭窄时,供血不足会造成心肌缺血。随着缺血时间的演化,心肌细胞的电生理功能会发生不同的变化,不同状态心肌细胞的电生理特性存在显著差异。按照心肌细胞电生理特性的不同,缺血性心脏疾病被划分为不同的病理阶段:缺血1a阶段（0-15分钟）、缺血1b阶段（15-45分钟）、短期心梗阶段（几天内）和长期心梗阶段（几周内）。本文基于电

学位

心脏生物起搏器计算模型构建及机制分析

电子起搏器在应用于临床的60余年间,挽救了千万心脏起搏障碍患者的生命,但其仍存在易受到电磁干扰、不能响应情绪导致的节律变化等问题。因此有研究者提出一种生物起搏器疗法:通过基因编辑的方式改变细胞膜上离子通道蛋白的表达,从而干预离子通道电流的特性,构建出具有自动节律的生物细胞;将其植入心脏中,来驱动心脏进行跳动,以代替电极的功能。生物起搏器应用于临床前,尚需解决几个问题:（1）离子通道电流如何影响起搏

学位

记录级及心拍级心电异常的检测方法研究

心血管疾病对人类健康构成严重威胁,同时也给社会造成沉重的经济负担。我国当前的心血管疾病防治工作面临发病率持续增高和医疗资源供应不足等诸多挑战。针对这些挑战,基于可穿戴心电硬件和智能心电异常检测算法的心脏健康监测服务将为心血管疾病的筛查和管理提供有效且经济的解决方案,有望在未来的医疗健康服务体系中扮演重要角色。心电信号可用于检测丰富多样的心脏异常状态,不同异常状态有着不同的发作周期和持续时间,因而对

学位

神经机器翻译的可解释性研究：模型的表示、训练与行为

近年来,神经机器翻译（Neural Machine Translation）取得了极大的成功,不仅仅作为机器翻译的一个全新范式而蓬勃发展,而且已经被应用于许多语言相关的技术中,例如:在线的通用多语翻译系统、同声传译系统、以及实时聊天助手等。标准的神经机器翻译框架由三个重要部件所组成:a)神经网络模型的体系结构（及其所学的内部隐层表示）,b)高效的（且多利用数据增强技术的）序列到序列训练策略,c)用

学位

图像检索中语义一致性映射的哈希编码表示

其他学术论文