基于矩阵分解和语义关联的跨模态哈希检索算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:five126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术持续不断的发展,网络中涌现了大量的多媒体数据,如视频、图片、文本等。面对如此多的数据,用户对检索的需求也发生了改变,人们不再满足单一模态数据的检索,如以文搜文,而更期待不同模态数据间的检索,即跨模态检索。目前,在大数据的背景下实现跨模态检索主要面临的主要问题为:如何关联不同模态的数据以及如何提高检索的效率。经过多年的探索,研究专家提出了基于哈希的跨模特检索方法。这类方法是通过将原始数据表示成二值的哈希编码,再利用二值的编码运算速度快及占用内存空间小的特点完成大规模数据的跨模态检索。本文对此展开了研究,研究主要内容如下:本文提出了一种基于矩阵分解和语义关联的跨模态哈希算法。该算法有以下几个优点:第一,由于各个模态数据自身的特性,它们表达信息的方式存在很大的差异,而目前的跨模态哈希算法大都通过学习一个的共同的潜在特征来表示多个模态数据,忽视了各个模态数据之间的差异,这不可避免的会造成某些模态数据的信息损失,进而影响检索结果。与现有算法不同,本算法学习各模态独立的潜在语义代表,然后生成对应的哈希码,从而保证每个模态数据内部关系不被破坏;同时,为了对学习到的哈希码进行相似性约束,本算法利用标签信息构造一个语义关联矩阵,能够在哈希码的迭代更新过程中,保证哈希码和原始模态数据的一致性。其次,针对哈希码的二值离散约束,现存的跨模态哈希算法大都采用松弛-量化的策略进行哈希码的学习,但此过程会产生大量的量化误差,为了解决这一问题,本算法提出一种不需要放松哈希码约束的策略,在迭代过程中,对哈希码进行逐位更新学习,能有效降低量化误差。第三,对于训练样本外的数据,现有的跨模态哈希算法大都通过矩阵伪逆计算产生相应的哈希码,这会导致数值不稳定,针对这一问题,本算法提出利用核逻辑回归学习能给训练样本外数据使用的非线性映射函数。实验时,将本算法和一些最新的跨模态哈希算法在三个公开的基准数据集中进行实验,结果表明,本文提出的算法具有更好的检索性能。
其他文献
5G时代的到来,标志着车联网的发展迈入了新的征程,推动车联网在自动驾驶、交通路况优化管理、丰富智能的车载系统方向的发展,人们可以尽情享受着科技进步带来的便利。不可避免的是,车联网衍生的安全问题(虚假广播、入侵攻击、隐私泄露等)已经成为国内外学者的研究热点。信任管理机制可以有效地针对节点行为做出可靠性评估,能高效、准确地识别出入侵节点,并将其携带的虚假消息从网络中剔除。为了解决传统密码学与公钥基础设
保障信息安全,在信息时代成为了人们最广泛的需求,而信息安全技术,离不开密码学。国密SM9算法是一种基于椭圆曲线的标识密码算法,由我国自主研发,在我国的商用密码体系中具有重要的意义。目前,SM9算法还面临着成本高、应用不够成熟、计算速度慢等问题。对于SM9算法的实现和研究都对SM9的进一步发展和应用有着重要意义。本文提出了一种基于SoC的软硬件协同实现的SM9签名验签系统。该系统通过硬件实现SM9算
液晶器件在人们的生活中扮演着很重要的角色,光电液晶材料如蓝相液晶、铁电液晶等,由于其优秀的外场响应能力,被不断研究应用于显示及光学器件领域。在这些材料中,有一类含偶氮苯翼的弯曲向列相液晶材料,这种材料在工业制造摩擦取向的液晶盒中显示出了优秀的光电响应特性,但是分子排列显示出的织构较差,且不方便于光场调控,难以实现应用。本文使用这种材料,基于液晶空间光调制器的偏振光控取向技术,制备了一种相位液晶器件
多视图数据通常可以由多个不同的特征集来进行描述,相比于单视图数据其包含了更多的判别信息,从而使得多视图特征学习技术在近年来引起了研究者广泛研究。多视图数据通常是高维数据,其不同视图之间的数据存在着互补性与冗余性,如何从多视图数据中学习合适的特征投影将高维的多视图数据映射到低维的数据空间中是降低计算复杂度与资源消耗的首要任务。其次,如何从不同的视图数据之间挖掘出有效的判别信息已成为多视图特征学习技术
随着大量工业自动化制造装备投入生产,电机协同运动的需求快速增长,永磁直线同步电机具有响应速度快、推力密度大和精度高等优点,能够很好地满足高精密加工、定位等协同运动需求。因此,多台永磁直线同步电机的协同运动控制成为研究热点,发展前景广阔。然而,多台永磁直线同步电机协同运动控制存在单台永磁直线同步电机跟踪精度低、多台永磁直线同步电机之间协同精度低的问题,难以满足实际应用要求。为此,论文深入研究了永磁直
缺陷检测是指在产品图像中定位出缺陷的位置以及识别对应位置缺陷的类别。它是产品生产过程中至关重要的流程,有利于把控产品的质量与及时反映生产过程中存在的问题。复杂纹理图像缺陷检测存在背景复杂、背景图案与缺陷特征信息相近、小面积缺陷等问题,是工业视觉检测的一大难题。因此,对复杂纹理图像缺陷检测方法进行研究,具有一定的科研价值和实用价值。针对复杂纹理图像缺陷检测存在的问题,本文基于深度学习技术围绕缺陷检测
随着物联网技术的快速发展,信息传输过程中诸如个人隐私等数据的安全已然受到严峻威胁,有关信息安全问题的研究也逐渐被越来越多的研究人员关注。密码学作为信息安全的基础,可以保障信息传递过程中的保密性、完整性以及抗攻击性等。哈希算法是密码算法的一种,它是单向散列函数,具有不可逆的特性,借由这种特性哈希算法可以应用于数据的完整性校验、唯一标识和数字签名等场景。近些年,伴随着密码学的发展,哈希算法也发展出了多
交通标志检测技术是高级辅助驾驶和自动驾驶的关键技术,也对智能交通系统的运行起着重要作用。自然场景中交通标志检测存在交通标志目标较小、外界环境复杂多变、干扰因素多等问题;此外,为了保障驾驶出行安全,需要交通标志检测速度快,满足实时行检测的要求。现有解决方法中基于Faster R-CNN等算法检测交通标志时速度慢,基于SSD、YOLO等算法检测交通标志时均值平均精度低。本文针对上述问题提出了基于改进Y
如今,对于全球各国而言,能源短缺均成为亟待解决的难题,严重阻碍了国家整体的发展。而太阳能,作为一种新兴能源,若能够对其实现充分的运用,能够使能源短缺的情况得到一定的缓解,且能够有效减少对环境造成的污染,因此在后续研发方面有着较为广阔的前景。但如何提高太阳能采集效率成为当下热门研究课题。因此研究一种高精度的太阳能追踪控制系统具有重大研究意义。本文主要对太阳能电池板当前在采光率、自动化等方面存在的问题
现如今,伴随计算机科学理论研究和高新技术的飞速发展,以及现实应用需求的增加,算法的性能要求也随之水涨船高。在无监督机器学习领域中,子空间学习方法因其高效性和高可解释性的特点而被广泛运用。国内外学者对无监督子空间学习方法做了许多研究。包括线性子空间学习方法、流形子空间学习方法和低秩子空间学习方法等。其中,低秩子空间学习方法通过引入低秩约束,可以较为完整地保留原始空间中数据点之间的全局结构信息。本文主