【摘 要】
:
近年来随着互联网和通信技术的飞速发展,用户上传、下载互联网中的视频数据变得越来越便利。这不仅导致了互联网中的视频数据的急剧增长,也给视频数据的处理和存储带来了极大的挑战。如何在海量视频数据中精准的查找用户所需的视频内容,成为了近年来多媒体领域需要迫切解决的关键问题之一。哈希学习可以将复杂的原始数据映射成极短的哈希码,并在哈希码中保持原始数据间的相似性,通过哈希码在数据库中进行检索,既可以大幅度提高
论文部分内容阅读
近年来随着互联网和通信技术的飞速发展,用户上传、下载互联网中的视频数据变得越来越便利。这不仅导致了互联网中的视频数据的急剧增长,也给视频数据的处理和存储带来了极大的挑战。如何在海量视频数据中精准的查找用户所需的视频内容,成为了近年来多媒体领域需要迫切解决的关键问题之一。哈希学习可以将复杂的原始数据映射成极短的哈希码,并在哈希码中保持原始数据间的相似性,通过哈希码在数据库中进行检索,既可以大幅度提高检索速度,又可以有效减少对存储空间的需求。因此,基于哈希学习实现图像和视频的检索,是近年来的一个研究热点。目前,哈希学习方法在图像检索中已有较多研究,取得了较大的进展,但在视频检索中的研究工作还比较有限,主要体现在哈希学习中对视频的时空特征编码不足,标签信息嵌入能力不强,且计算复杂度较高,这导致检索哈希检索性能与应用需求还有较大的差距。因此,本人选择基于哈希学习的视频检索作为研究课题,以进一步提升视频检索的性能。本论文研究了一种基于三元组的深度视频哈希检索方法,并对所提方法的性能进行了实验验证。主要研究工作概括如下:(1)基于卷积神经网络和长短时记忆网络,提出了一种端到端的有监督视频哈希编码网络。在该网络中使用卷积神经网络对视频中的帧图像进行特征提取,并通过长短时记忆网络对时序信息进行融合,实现了视频视觉特征和时空特征的有效编码。(2)利用视频三元组标签相似性信息进行网络模型训练,并通过哈希码分类模块强化监督信息嵌入,加强生成哈希码的判别能力。本文模型的损失函数联合了三元组哈希损失和分类损失,使得模型对视频进行哈希编码的同时也保留了原始视频的邻域相似性。(3)在深度哈希网络中加入了对二值哈希编码的性质约束,使得模型生成的哈希码具有更优异的性能。该约束改善了哈希码各位上的数据分布,使哈希码分布更加平衡。此外,该约束项对哈希码不同比特位之间的相关性进行限制,避免在不同比特位上信息冗余。在三个大规模视频数据集上的实验结果表明,本论文所提出方法有效地提升了视频检索的效率和准确度,在平均精度均值、精度-召回率曲线等多个性能指标上取得了优于现有哈希学习方法的性能。
其他文献
番茄是全球重要的经济作物,其果实含有丰富的营养成分。近年来,在延缓采后番茄果实成熟衰老和延长果实货架期等方面的研究十分深入。硫化氢(H2S)是植物中广泛存在的小分子信号
目的:观察益肾胶囊对糖尿病肾病大鼠肾组织SIRT6、podocin表达的影响。方法:SD健康大鼠40只,随机选择30只大鼠采用左肾切除后一次性注射链脲菌素(Streptozotocin STZ)建立糖尿病肾病模型,实验分组为:正常组、糖尿病肾病组、益肾胶囊组、白藜芦醇组,益肾胶囊组每只大鼠灌胃益肾胶囊625mg·kg-1·d-1,白藜芦醇组每只大鼠灌胃白藜芦醇30mg·kg-1·d-1,正常组及糖
近年来,5G技术、物联网、车联网等网络信息技术正在蓬勃快速的发展,并在家庭、工作区域、公共区域等领域进行了大规模投入使用。自然地,人们对频谱资源的需求越来越多,而实际环境中频谱资源却是越来越稀缺。同时,研究者发现目前主流的频谱分配机制主要包括固定分配方式和接入方式,这两种机械分配机制导致有效频谱的使用率处于较低的状态,因此科技工作者将研究的重点转向如何提高频谱利用率的方面。而认知无线电技术的应用一
如果一个划分将图G的顶点集分成k个不相交的子集,则称这个划分是图G的一个k部划分.图的一个k部划分如果满足‖Vi|-|Vj‖≤1对任意的j,j ∈ {1,2,...,k}都成立,则称这个划分为k部平衡划分.本文主要研究图的五部平衡划分问题.本文的主要结果如下:1.G是一个有n个顶点和m条边的图,其中δ(G)≥≥4[n/5],且r是实数,则图G存在一个最大五部平衡划分V1,V2,V3,V4,V5,使
目前,无人机的应用日益广泛,在民用和军用等领域的应用价值不断凸显。从飞行平台构型来看,无人机通常可分为固定翼无人机、无人直升机、旋翼无人机和扑翼飞行器。当前,固定翼
《草原颂》是蒙古族作曲家永儒布(作曲)与中国诗歌学会理事陈光林(作词),为庆祝内蒙古自治区成立60周年所创作的大型交响合唱。作品共有九个乐章,每个乐章都围绕“草原”主题从不同层面、不同角度表达对草原的歌颂与赞美。除绪论与结语外,本文主体内容包括四章。第一章主要研究《草原颂》主题的形象塑造与旋律的语言特色,包含对各乐章“草原”主题内容与发展手法、核心音调的贯穿方式、民歌语言以及语言音韵与旋律结合方法
Haber-Bosch法作为工业上最重要、最广泛使用的固氮工艺,为科技进步和社会发展作出了巨大贡献。然而,此工艺需要严苛的反应条件,并需要巨大的能耗,因此,寻求高效、低耗、清洁的固氮方法成为人们研究的热点。近年来,人们把非常有前景的光催化技术应用至固氮方向,赢得了科研工作者的口碑。基于此,通过醇热法、贵金属沉积法、离子掺杂法、光还原法等方法制备了系列δ-Bi_2O_3基光催化剂,并在常温常压下,研
近年来,随着全球新能源汽车以及移动电子设备的爆发式增长,对以锂离子电池和超级电容器为代表的便携式电化学储能装置提出了越来越高的要求。电极材料作为超级电容器的核心,
飞机在发射或投放导弹、炸弹、副油箱等外挂物时,为避免这些外挂物与飞机发生碰挂,必须对从飞机发射或投放后的外挂物的运动轨迹进行模拟测量。而模拟测量需要一套放在风洞中的六自由度机构。本文设计了一套新的六自由度机构,并对该机构进行了运动学、动力学以及轨迹规划进行了研究。1)针对以前设计的风洞捕获六自由度机构不能满足现在行程的要求,本文提出了一种新型六自由度机构;由于D-H法所有运动都是关于X轴和Z轴的,
可再生绿色新能源领域的研究是解决当前环境污染与能源短缺这两大世界难题的有效途径之一。氢能作为一种高效的清洁能源,近年来一直被视为具有发展前景的新能源,受到了世界各