跨媒体元搜索关键技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：music_cat

【摘要】

：

随着互联网、数字图书馆等的快速发展，在线资源库中的数字资源逐渐从单一的文本和数值媒体类型转变为包含越来越多的图像、音频、视频、动画等多媒体信息类型，特别是近几年来，基

【作者】

：

周志

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2009年期

【关键词】

：

跨媒体检索元搜索跨媒体融合维基百科交叠文档图像检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网、数字图书馆等的快速发展，在线资源库中的数字资源逐渐从单一的文本和数值媒体类型转变为包含越来越多的图像、音频、视频、动画等多媒体信息类型，特别是近几年来，基于Web2.0环境的视频分享(Youtube)、照片分享(Flickr)、博客(Blog)、播客(VBlog)等的出现使得任何人都可以在互联网上发布自己的文章、图片和视频信息，在线媒体信息的创作从少数人发布信息转变成大众化的媒体创作，从而带来了多媒体信息资源的爆炸式增长。　　多媒体在日常生活中的重要性毋庸置疑，然而如何在海量多媒体资源库中寻找所需要的多媒体资源成为尚待解决的难题。因此，跨媒体检索(cross-media retrieval)近年来成为信息检索、计算机视觉、数据挖掘、数据库等领域的热点研究问题。　　本文以基于Web的多媒体检索为应用目标，以跨媒体图像检索为具体应用实例，进行了以下研究工作：　　首先，本文对跨媒体检索所涉及的相关领域进行了总结。特别地，将本领域常混杂使用的跨媒体检索和跨模态检索等概念进行了梳理。论文将跨媒体检索中的关键问题定位到跨媒体融合问题，并从特征层融合和结果层融合两个层次去研究融合策略，以跨媒体元搜索引擎作为基本的研究框架。　　然后，基于图像检索比赛ImageCLEF2008的WikipediaMM任务，论文对实验平台上的超过150000张图像进行了跨媒体的检索实验。论文提出以Wikipedia为基本信息源，提取知识库以支持基于文本查询扩展的检索。另一方面，利用Yahoo!图像检索等搜索引擎，论文将基于图像内容的检索中查询样例扩展到以若干图像表示的概念，从而将图像内容检索问题转换为一个二元分类问题。对于前面的检索结果，本文使用结果集交叠统计特征来对多种媒体类型的检索结果进行融合。实验结果表明，本文提出的文本查询扩展方法、图像内容扩展检索方法、以及基于交叠的跨媒体融合方法均优于其他参赛队伍所提交的结果。　　第三，本文提出了一种基于簇和交叠的二维跨媒体融合模型(BiDimFusion)。在这个模型中，本文对基于结果集纵向交叠的融合策略进行了进一步细化，提出基于局部交叠密度的跨媒体融合方法；同时，通过对图像样例的聚类分析，为隶属于相同簇的图像和查询学习出不同的自适应融合策略。实验结果表明，模型的每个维度都能显著改善检索性能，并且性能要优于仅基于局部交叠密度的融合方法和仅基于聚类的方法，在整体性能上也略胜目前较好的元搜索引擎融合模型。　　最后，本文将前述的跨媒体检索方法用于现实的多媒体信息检索，设计并实现了一个跨媒体信息检索系统MSearch。该系统部分解决了现在多媒体信息检索中的媒体信息融合和系统实用化问题。这个系统包含多媒体查询构建与处理模块、文本检索模块、图像内容检索模块、跨媒体融合模块、互联网服务模块。Msearch系统还在中国联通奥运城市通的数据集上进行了应用，处理并检索了包括文本、图像、视频、地理信息数据等多媒体多模态数据，实际应用和实验表明系统在性能上能够达到较好的效果，能够满足实用化的要求。

其他文献

SIP/IMS会议中央服务器及发言权控制的设计与实现

目前已有的成熟多媒体会议系统大多基于H.323协议族,H.323提供了较完善的音视频的会话控制功能,但由于其协议的复杂性,不易于开发和扩展。而IETF提出的XCON会议框架建立在SIP

学位

多媒体会议系统XCON发言权控制SIP协议BFCP协议

基于DeviceNet现场总线的即插即用技术的研究与实现

DeviceNet总线是一种基于CAN总线技术的符合全球工业标准的通信网络。同时,它还是一个开放的网络标准,其规范和协议都是开放的,具有良好的互换性,使得不同供货商的产品可以互

学位

DeviceNet协议μC/OS-Ⅱ操作系统ARM即插即用

一个符合SHA-3征集规范的杂凑函数的设计和研究

杂凑函数在现代密码学中占据基础而重要的地位，它将任意长度的消息压缩成固定长度的杂凑值，主要用来保证数据完整性、消息认证、优化数字签名等，目前最常用的一类杂凑函数称为MD

学位

密码学杂凑函数压缩函数工作模式

基于N维圆性质的信息保密若干关键技术及在网格中的应用研究

信息技术的发展呼唤新的信息安全技术，本文对基于n维圆性质的信息加密、身份认证、门限秘密共享及安全群组通信等关键技术进行了研究和探讨。并在此基础上设计实现了基于n维圆

学位

身份认证身份认证秘密共享秘密共享群组密钥管理群组密钥管理圆性质圆性质信息安全信息安全信息加密信息加密概率对称加密算法概率对称加密算法

面向地学应用的专家系统架构

通过分析专家系统的发展，组合常用专家系统的模型和模型中的部分核心技术，充分考虑各种不确定因素，根据地学领域知识的特点，建立了一种面向地学的专家系统不确定性推理模型。　　

学位

地学专家系统不确定性推理模型测井曲线地层厚度沉积微相

体数据中物体间关系描述及其在医学图像分析中的应用

体绘制作为一个强大的解释和分析体数据的工具，近年来成为数据分析领域的研究热点并具有广泛的应用价值。传统的体数据分析过程把体绘制主要作为绘制工具可视地表示物体以增强

学位

体绘制体绘制隐藏关系隐藏关系拓扑关系拓扑关系医学图像分析医学图像分析数据分析数据分析

量子音频、图像加密算法研究

多媒体信息作为一种重要的资源,其安全性成了人们关注的重点。随着信息技术的不断进步和研究的不断深入,人们虽已提出了许多加密方案,但是大部分方案被证实存在一些缺陷,如效

学位

音频加密图像加密量子随机游走量子细胞自动机

基于UWB与FIRD的混合定位系统研究

近年来，随着无线传感器网络技术及无线定位技术的迅速发展，对定位需求变得越来越迫切，无线定位的研究和应用也就成了当前的热点。出于对人员安全以及物流自动化管理的考虑，越来越

学位

混合定位粒子滤波器无缝定位引擎定位精度

空间栅格数据嵌入式小波编码与渐进传输研究

空间栅格数据特别是遥感影像和格网DEM数据的嵌入式小波编码和网络渐进传输的研究对于空间信息服务中数据的有效分发具有重要理论与实际意义。本文将数据的压缩与传输相结合，

学位

遥感影像可逆整数提升小波嵌入式小波编码渐进传输空间栅格数据编码算法

基于OWL-S语义工作流结构正确性验证研究

工作流模型是工作流应用的生命线，工作流过程建模是一个复杂且易错的过程，如何确保模型质量的问题引起了研究界和工业界的高度重视，在建模阶段进行有效的模型验证是十分必要的。

学位

工作流验证工作流结构工作流模式工作流管理Pi-演算OWL-S模型转换

跨媒体元搜索关键技术研究

其他学术论文