基于矩阵分解和深度对抗的高效多媒体检索方法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：zengbiao2010

【摘要】

：

【作者】

：

何仕远

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

大规模多媒体检索矩阵分解哈希对抗学习自监督学习模态差异

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着互联网大数据的发展,各种形式的多媒体数据（图像、文本、视频、音频等）呈现出爆炸式的增长。而对大规模多媒体数据精准、有效的检索也随之成为一个新的研究热点和难点。多媒体检索的任务目标是实现以一种数据类型作为查询来检索得到本类型或其他类型的相关数据。例如,用户可以使用文本检索相关的图片或视频。本文针对大规模多媒体检索的重点和难点问题进行研究,深入探索了大规模多媒体检索已有方法存在的一些问题及其解决方案,提出了一系列更加先进的方法来提高检索准确率,从而实现对多媒体数据更加高效、精准的检索。这些方法可分为单模态和跨模态两类。1)本文中的单模态检索主要是对图像样本的研究,它的任务是从海量的图像数据库中利用近似最近邻搜索的方法检索出与目标图像相似的图像。针对此场景,本文提出了一种新的无监督哈希方法:双向离散矩阵分解哈希（BDMFH）。它由两个交替进行的过程组成:a)从数据种学习得到二进制码;b)利用二进制码恢复原始数据。本文设计了逆因子分解模型,使学习到的二进制码可以从原始的可视数据中有效地继承固有结构。在三个大规模基准数据集上的综合实验结果表明,该算法不仅具有较好的性能,而且具有较好的计算效率。2)跨模态检索旨在实现跨不同多媒体类型的灵活检索。跨模态检索的核心是学习不同模态的投影,并使学习到的共同子空间中的实例具有可比性。由于想要查询或检索得到的结果可能是以不同的多媒体形式呈现的,所以如何度量不同媒体类型数据之间的内容相似性是一个极大的挑战,而研究人员提出的各种方法也都围绕这个研究难点进行探索。本文提出了两种基于对抗学习的跨模态检索方法:自监督对抗学习（SSAL）和类别对齐对抗学习（CAAL）。SSAL采用自监督学习和对抗学习的方法寻找有效的公共子空间。CAAL的学习目的是寻找一个由类别信息监督的共同表示空间,在这个空间中可以直接比较来自不同模态的样本。在多个广泛使用的基准数据集上的综合实验结果表明,所提出的基于对抗学习的两种方法具有较好的跨模态检索性能,显著优于现有的跨模态检索方法。

其他文献

基于知识图谱的广电节目推荐系统设计与实现

科技的高速变革不仅使大众的生活更加便利,而且也使人们的业余生活更加丰富多彩。现在人们获取影视节目的主要方式已经从电机频道转变成了互联网平台,人们的选择越来越多,用来观看节目的时间也更加灵活化,大家正在享受信息发展带来的便利。信息技术的发展也带来了信息过载的问题,人们面对互联网上海量的影视节目,往往无法很快选择出自己喜欢的内容。个性化推荐系统就是在这种背景下出现的,它的出现在一定程度上解决信息过载问

学位

信息过载影视节目推荐系统知识图谱

面向多核环境的微内核操作系统研究与实现

随着嵌入式领域的不断发展以及处理器体系架构的持续优化,多核处理器因其高性能、低功耗和低成本等优势得到了广泛的应用。同时,在万物互联的时代,嵌入式设备面临着越来越多的风险和挑战,这不仅需要增强设备的可靠度和安全性,还需要具备高扩展能力。而微内核架构因其本身的架构特点,具备代码量小、可扩展性高、安全可靠等优势,十分适合应用在嵌入式设备中。因此,本文基于团队自研的mginkgo微内核,设计并实现一个面向

学位

多核处理器多核操作系统对称多处理微内核

支持情感与多样性的对话生成方法研究

近年来,随着深度神经网络的快速发展,基于循环神经网络的模型在机器翻译领域取得了非常显著的成果。因为对话的生成也可以看成是从输入到回复的一种翻译,所以将其应用到对话系统上也是一种非常有前景的方式。并且随着互联网的发展,网络上开始涌现出大量开源的对话数据集,这也使得以数据驱动和端到端的方式训练生成式对话系统成为可能。本文主要研究的是开放域生成式对话系统。不同于特定域的对话系统,其主要目的是和用户闲聊,

学位

对话系统CVAE模型VHRED模型情感多样性

基于知识图谱的数据清洗技术研究与实现

随着大数据时代的到来,数据成为企业的核心资产,分析和挖掘数据的潜在价值对企业业务发展和关键决策具有重要作用。数据集成是数据挖掘分析的基础,数据集成中,多源异构数据可能存在数据缺失、不一致等数据质量问题,而数据清洗是保证数据质量的重要手段之一。数据清洗技术需要依赖大量外部知识来指导清洗过程,但由于外部知识规模较小、构建低效等特点,限制了数据清洗效率。而知识图谱具有知识规模大、语义丰富等特点,因此,研

学位

数据清洗知识图谱错误修复知识推理外键

基于知识蒸馏的医学图像模型压缩方法研究

近年来,以卷积神经网络为代表的深度学习方法在医学图像的分类、分割等任务上取得了超越传统方法的成绩,得到了越来越广泛的研究和应用。但是,一方面,由于医学图像的特殊性,适用于自然图像的深度学习模型在用于医学图像上时,模型精度会有所下降;另一方面,现存的深度学习模型普遍计算量大、参数过多,应用于硬件资源受限的设备时存在一定难度,大模型也在训练集数据少的情况下出现过拟合的问题。为了改善和解决上述问题,本论

学位

深度学习模型压缩知识蒸馏医学图像

多普勒超声评价颈动脉状况与脑梗死的关系

目的探讨多普勒超声评价颈动脉粥样硬化斑块性质及狭窄程度的效果，分析其与脑梗死的关系。方法回顾性分析本院2020年2月至2021年1月76例确诊脑梗死的患者作为观察组，纳入同期住院或门诊非脑梗死患者60例为对照组；2组均接受多普勒超声评价检测颈动脉粥样硬化斑块，对比评价该检查项目对缺血性脑血管病的检出价值。结果经多普勒超声检查出对照组有39个斑块，观察组135个斑块，观察组不稳定斑块数目明显高

期刊

超声检查多普勒彩色斑块动脉粥样硬化颈动脉狭窄脑梗死相关性

基于区块链的数据共享与交换平台的研究与应用

随着计算机科学与技术的快速发展,人们生活质量得到改善的同时,每天产生的数据也在以指数级的速率增长。在这个数据爆炸的时代,由于人工智能、数据挖掘等技术的出现以及快速的发展,数据的潜在价值逐渐被人们重视起来。我们可以从今年3月份发表的《关于构建更加完善的要素市场化配置体制的意见》中看到,国家已将数据视作了生产要素,与其它要素一起融入了经济价值创造的过程之中,可见数据在国家层面得到了最高的认可。然而数据

学位

区块链智能合约数据共享数据安全

机打票据图像结构化技术研究及应用

随着计算机技术的发展,自动化、智能化业务系统的需求日益增长。机打票据在企事业中被普遍应用,业务流程中信息的自动识别对成本节约具有重要意义。然而,现有的方法大多要求专业的图像采集设备,识别效率也有很大的提升空间。因此,研究简单且成本低廉的机打票据识别系统具有重要的现实意义。传统的光学字符识别（Optical Character Recognition,OCR）开源软件仅仅可以对文章等简单文本内容进行

学位

深度学习光学字符识别生成对抗网络结构化信息主动学习

基于SDN的天地一体化网络地面基站选择及传输协议优化

随着卫星技术、高速光纤传输技术的逐渐成熟,天地一体化融合网络理念逐渐被大众接受并推广。SDN作为一种较为新型且技术生态相对完整的网络架构,通过解耦控制层与转发层,以软件形式实现了对全网资源的掌控与调度。通过SDN技术将天网与地网协同一体,可以极大程度发掘出天网的潜力。星地协同中传输链路的传输质量会受到基站所处的地理位置、地形、天气等外在因素的影响,因此为了最大限度保障服务质量,本文通过SDN控制器

学位

天地一体化网络软件定义网络SDN传输协议优化基站选择

分布式列式内存数据库事务系统的设计与实现

经历多年发展,分布式数据库领域逐渐细分,可以按处理方式不同将其划分为面向事务处理的数据库（OLTP型）,面向数据分析的数据库（OLAP型）以及较新颖的混合两种功能的数据库（HTAP型）。其中AP和TP类型的系统发展已经相对成熟,而当前市面上虽然已经存在不少的HTAP实现方案,但大部分是基于行列混合存储的方式实现,事务的实现仍依赖于行式引擎,列式引擎数据需要从行式存储中同步得到,而直接面向列式存储的

学位

MVCCHTAP内存数据库列式存储分布式事务

基于矩阵分解和深度对抗的高效多媒体检索方法

其他学术论文