在线跨模态哈希检索算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:a595165933
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,多模态数据越来越多,人们对多个模态间数据检索的需求也越来越大,跨模态哈希是一种有效的跨媒体检索方法。大多数现有跨模态哈希方法都是基于批处理学习模式学习哈希函数,这种模式不能有效处理大规模数据集,内存消耗大,并且训练流数据效率低。在线跨模态哈希可以通过在线学习哈希模型来解决上述问题。然而现有的在线跨模态哈希方法虽然可以在线更新哈希模型,但是不能通过新学习的模型更新旧数据的哈希码。而且大多数在线跨模态哈希方法主要关注于将不同模态的数据映射到一个公共的低维空间中,从而消除不同模态之间异构性,实现跨模态检索。但是由于忽略了多模态数据模态内相互关系,最终学习到的哈希编码检索精度不高。此外,大多数在线跨模态哈希检索方法在模型学习的时候,采用先松弛离散约束去求一个近似的连续解,然后使用符号函数量化得到离散的解,这种方式虽然可以避免离散约束造成的NP困难问题,便于求解,但是存在大量的量化误差,使得哈希码的检索精度下降。本文针对上述问题进行研究,分别提出了三种在线跨模态哈希检索方法。主要研究内容如下:(1)针对现有在线跨模态哈希检索算法无法通过新学习到的模型更新旧数据的哈希码的问题,提出在线协同矩阵分解跨模态哈希检索方法。该方法利用协同矩阵分解学习不同模态数据的公共隐含因子,通过量化公共隐含因子得到不同模态数据的统一哈希编码。与传统的基于批处理模式的方法不同,该方法仅通过新到达的数据点对哈希函数进行重新训练,同时,生成新数据的哈希码。并通过最新更新的哈希模型更新旧数据的哈希码。因此,新数据和旧数据的哈希码间的差异较小。在三个常用数据集上的大量实验证明了该方法在在线跨媒体检索中的有效性和高效性。(2)针对现有在线跨模态哈希检索算法重点关注于多模态数据的模态间相关性,忽略了多模态数据的模态内相关性,使得学习到的哈希码检索精度不高问题,提出在线图正则化非负矩阵分解跨模态哈希检索方法。该方法利用经典的非负矩阵分解对模态维度较高的数据提取语义特征,将不同模态数据映射到公共的汉明空间,并通过图正则化来保持多模态数据之间的相似性。以增量的方式处理输入的数据,在线学习哈希码和哈希函数,通过建立缓冲区方式处理大规模数据。充分利用了单一模态内的局部流形结构信息和数据的类别标签信息,得到判别性更高的哈希码。实验结果表明,与现有的在线哈希方法相比该方法检索效果更好。(3)针对现有在线跨模态哈希检索算法采用松弛策略导致的哈希码存在大量量化误差问题,提出在线离散跨模态哈希检索方法。该方法通过将语义标签回归到哈希码,建立原始数据和哈希码的联系,对哈希码的学习过程进行监督,并且可以直接求解哈希码避免了松弛策略带来的量化误差问题。该方法在哈希学习过程中,不需要存储大量的历史数据,仅需要使用新到达的数据更新哈希函数。实验结果表明,该方法不仅速度快,而且性能优于其他同类方法。
其他文献
随着中美贸易战的上演,许多出口企业面临关税增加和客户的降价的双重巨大压力,如果不改变,就要被市场所淘汰。为了提升竞争力,企业除了降低价格,就是进一步提升产品质量,说到提升质量,国内除了沿用国际标准ISO9001的质量标准体系外,就是利用质量工具和质量管理方法来提高产品质量。目前最为流行和比较实用的就是六西格玛改进模型,很多国内企业在使用六西格玛改进模型后取得不错的效果。本文以五金家具行业K公司为例
信息不对称以及代理问题是上市企业中的常见问题,高质量的内部控制可以很大程度上缓解和解决这些问题,由利益相关者的理论可知,当企业落实内部控制制度时,股东和企业管理层趋向于共同利益,管理层才更容易对企业的投资决策做出正确且合理的判断,这个影响过程会对企业的绩效水平起到积极影响。对于目前所了解到的大多数文献中,处于理论领域中的学者对于内部控制质量的研究愈发详尽,其中很多研究是从股权结构、外部治理或独立董
学位
图像融合是指利用计算机技术,提取同一目标图像数据多源信道中的有效信息,将其综合成高质量图像的技术,在图像处理领域发挥着巨大作用。随着人工智能科技的发展,神经网络在图像融合技术上大显身手。本文研究了基于神经网络及方向滤波的多聚焦图像融合算法。针对该数据集的特点,设计不同方向角度的方向滤波器并将其预置进反卷积神经网络模型中;利用坐标上升法调整滤波器的截止频率,通过完成网络训练,得到学习后的滤波器组,使
流程挖掘作为业务过程建模与分析的重要手段,已在计算机科学、管理科学、数据科学等多个领域得到了广泛的关注。目前的流程挖掘方法大多立足于事件日志,从中发现业务过程的相关知识。然而,现实世界中的大部分流程信息蕴含在自然文本中,如菜谱、病人入院诊疗记录、应急预案等,这种蕴含自然流程信息的文本为流程挖掘提供了新的数据基础和应用场景。因此,对这种自然文本的流程挖掘研究有重要意义。然而,由于自然文本是一种无结构
随着旅游业的快速发展,乡村旅游产品满足游客多样化的需求,因此在国内引起了大量旅游者的关注,逐步发展为国内旅游业的今后的发展方向。近年来,少数民族地区的旅游产业均兴起繁荣发展,图们市水南村积极响应国家经济政策,大力发展乡村旅游业。当前,水南村乡村旅游产业整体呈良性发展趋势,但是进入初级阶段的水南村旅游产品在供给方面存在着不足之处。本文以图们市水南村作为研究案例,在收集、归纳和整理国内外关于乡村旅游研
随着航空技术的不断发展,地空通信蓬勃发展,飞行器与地面站之间的通信具有各种各样的形式,包括数据、语音和视频在内的双向数字通信,支持许多不同的应用;其中空地宽带数据传输涉及许多重要的特殊应用,这是本文研究的重点。由于飞行器的体积、重量、功耗严重受限,一般都不能采用多天线、多载波调制形式发送信号,因此空地宽带数据传输信道经常出现非常严重的多径效应。例如:导弹或小型无人机航拍视频传输系统,当传输距离较远
流化床反应器具有反应效率高,燃料适用性广和环保性能好等优点,其已成为工业反应的主流,并在工业生产中占有重要地位。本文的研究对象是一种新型的四流化床气化系统,其结合了双流化床气化和化学链空气分离技术,能在实现高效气化的同时降低碳排放量。然而,关于此系统的研究还停留在理论分析层面,因此下一步重点是对该系统的气固流动特性和内部耦合影响机制进行研究。为了探究四流化床系统的特性,本文采用冷态实验的办法,为此
本研究以“形式聚焦”、“输出假说”和“注意假说”为理论框架,探究四种不同的读写组合模式对高中学生英语词块习得的影响程度。本研究试图回答以下两个问题:(1)四种干预手段对高中学生目标词块习得的即时效果分别是什么?(2)四种干预手段对高中学生目标词块习得的延时保持效果分别是什么?研究对象是江苏省南京市某高中高一的四个平行班共124名学生。每个班接受读写结合的不同干预方式,分为四个组:阅读-写作组(R-
近年随着计算机科学的快速发展,态势感知技术取得了显著进步,主要体现在出现了许多以机器学习技术为基础的态势感知模型。但随着人因工程、认知科学的重新兴起以及人们深度学习、大数据等技术的反思。这些模型通常忽略了对被试的心理模型、认知过程等主观因素。将主观量表数据与客观传感器数据进行融合、建模和测量,对态势感知模型的研究具有重要意义。本文对态势感知测量技术、态势感知相关理论模型以及态势感知技术的应用进行了