基于耦合关系的跨模态哈希检索

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qq_13439718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网、物联网和云存储的高速发展,多模态数据(包括图像、文本、视频和音频等)已经成为互联网上的主要信息载体,其数据规模呈现爆炸式增长。这些庞大的多模态数据资源蕴含着丰富的经济价值和社会价值,为国民经济与社会发展带来了新的挑战和契机。因此,如何实现不同模态数据间的检索成为信息检索领域的研究热点。跨模态哈希检索通过构造哈希函数,将不同模态数据的高维特征映射成低维的二进制哈希码,并在汉明空间中保持了原始数据间的近邻关系,具有存储所需空间小和检索速度快的优点,在跨模态检索领域得到广泛关注。跨模态哈希检索面临底层特征和高级语义间的鸿沟,这是该研究领域的难点之一。同时大部分方法局限于使用表征能力有限的手工特征。本文围绕这些难点进行深入研究,提出了两种基于耦合关系的跨模态哈希方法。论文的主要工作如下:(1)提出了一种基于关联耦合的跨模态哈希检索方法。考虑到多模态数据的结构异质,该方法摈弃了将不同模态数据直接投影到共同汉明空间的做法,而是将各模态数据投影到对立模态的汉明空间,以此将不同模态关联耦合。同时,根据矩阵分解能挖掘隐语义空间的特性,以矩阵分解为框架,利用哈希码对原始数据进行重建嵌入。该方法通过挖掘隐语义空间,既提高了特征的表征能力,又有效克服了语义鸿沟,使各模态数据能够紧密耦合。实验结果表明该方法不仅可以取得理想的检索准确率,而且检索效率较其他方法也有较大提升。(2)提出了一种基于深度耦合的跨模态哈希检索方法。为了解决手工特征表征能力有限的问题,首先分别利用CNN-F和MLP这两种深度学习网络提取多模态数据的特征,然后在网络末端输出哈希码,将特征提取和哈希学习整合到统一框架中。该方法从两个方面对多模态数据进行耦合,一方面利用深度卷积网络挖掘表征能力更强的特征,另一方面利用由类别标签生成的相似度矩阵,从两个角度对跨模态哈希码进行成对约束。实验结果表明该方法的检索效果优于同类方法。
其他文献
伴随着国际全球化趋势迅猛发展,国际直接投资日益成为推动其不断发展的主要动力。于是,继贸易自由化之后,国际投资领域也出现了自由化的新浪潮。与此同时,我国对外投资规模越来越
临床实习是医学检验专业学生专业培养环节的重要组成部分。当前医学检验专业实习教学活动中存在一些问题,直接影响了实习学生技能和专业素质的培养。因此,加强和提高医学检验
随着沥青混凝土基础理论和路面工程技术的迅速发展,沥青混凝土已成为最重要的高速公路路面结构材料,同时还被广泛应用于机场跑道。因此,从军事需出发,研究沥青混凝土材料在高
称取0.500 0g样品置于镍坩埚中,加入2.5g氢氧化钠,再覆盖0.5g过氧化钠,盖好坩埚盖,置于马弗炉中,升温至700℃并保持7min,取出冷却,用50mL热水溶解熔融物,将溶液转移至100mL塑
泽库县近年来大力发展牛羊产业,饲料粉碎机在泽库县使用较前几年大幅度增加,但由于农牧民技术掌握程度不高,经常造成饲料粉碎机故障频发,甚至造成农机安全隐患。因此掌握好饲
<正>11月1日,由复旦大学医院管理研究所牵头研制的"2013年度中国医院排行榜"新鲜出炉。在榜单中,荣膺综合医院排行榜前三甲的分别是:北京协和医院、四川大学华西医院和中国人
本文设计合成了两种新的选择性识别过渡态金属离子的含二茂铁单元的多胺化合物和三种新的带侧臂与吡啶环的四氮杂大环化合物,进行了二茂铁多胺化合物以及带侧臂的四氮杂大环化
铅锌矿常与硫化矿共生形成复合多金属矿床,其中伴生有益元素的含量对矿床的综合利用评估有重要的参考意义。在目前常用方法中,钨钼锡锗硒碲主要采用分组或单独熔矿和测试的方
采用数据可视化分析方法,对2014-2017年上半年我国纺织服装出口欧盟遭受召回的通报数据进行研究,得出产品召回风险点和召回原因数据字段的关联信息,以期为纺织服装出口生产企
为综合评价城市轨道换乘站,采用查阅文献与调查问卷的方法选取评价指标,建立城市轨道交通换乘站评价体系,将与其他交通方式衔接加入评价体系中,通过层次分析法计算出每个指标