融合多模式信息特定音频检索技术研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:fljk888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字媒体技术的发展,越来越多的人能够更加方便地接触到数字媒体。多媒体检索的目的是从大量的多媒体资源中自动地查找与用户查询请求相关的各种多媒体信息。电视媒体是信息传播和休闲娱乐的主流平台,而电视广告占总媒体投资中的70%的份额。因此给用户提供准确实时的广告检索具有很大的应用前景。由于融合多模式信息的方法充分考虑了广告中的视频和音频两种媒体,并且数字指纹技术能够很好的解决广告检索中准确性和实时性的难题,因此本论文主要针对广告检索中关键技术的难题开展了深入系统的研究。本文在对现有的方法分析的基础上,主要取得以下研究成果:1.提出一种快速的音频指纹提取方法。针对广告音频,对音频数据按帧进行傅立叶变换获取频域信息,提取每帧感知最相关的频带信息,将这些频带平分为33等分,并提取相邻两帧相邻频带的差异作为指纹值,每帧提32个0/1值。实验表明,该方法具有快速准确的特点,速度比Jaap Haitsma的方法快30倍,比Jin S. Seo的方法快3倍,能够满足实时的要求。对有目的的攻击,准确性比Jaap Haitsma和Jin S. Seo的方法有显著的提高。2.提出一种融合多模式信息特定音频检索方法。通过结合音视频指纹对特定音频进行检索。采用对音视频指纹加权的方式进行结合,充分考虑到音频指纹的准确性,并利用视频指纹弱化“静音”广告的影响,与单一的指纹方法相比,检索结果更加准确,阈值自适用性有所提高。3.建立一个融合多模式信息特定音频检索系统。将视频指纹和音频指纹方法结合起来,通过多线程编程,建立一个融合多模式信息的特定音频检索系统。
其他文献
进入21世纪后,科学技术取得了突飞猛进的反展,高科技产品、技术正以前所未有的速度进入人们的生活中,给人们的生活带来了巨大的改变,尤其是以通信技术、互联网技术、软件技术
随着电子信息时代的到来,计算机技术和网络技术得到了迅猛发展,国内外大部分公司都逐渐引入办公自动化系统,但是当前企业和公司的网络管理水平相对比较低,管理方法比较混乱,
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘领域产生了许多新概念和方法。特别是最近几
随着我国经济的不断发展,焊接已经成为制造业中非常重要的工艺技术。在我们生活的各个领域所需的产品中,几乎都要用到焊接技术。特别是手工电弧焊因其具有灵活、经济、设备简单
网络技术的快速发展和网络应用的普及给人类生产和生活带来了革命性的变化,这也使得人类面临着一种新的威胁—网络安全。入侵检测技术作为一种必要的安全手段,在网络安全领域
随着多媒体技术的发展和Internet的普及,人们获得各种多媒体信息越来越容易,其中图像是数量最多的一种,如何有效地、快速地从大规模图像数据库中检索出所需要的图像已成为人
随着网络的发展及普及,电子文档正以惊人的速度增长。如何从这些海量信息中快速、准确地提取有价值的信息已经成为人们关注的焦点,这给信息检索技术带来了机遇和挑战,同时也促进
网页是传递信息的重要载体,以网页作为研究对象是现今信息检索与信息抽取研究的必然趋势。鉴于句子既是传递信息的基本单位,又是表达完整意思的语言单位,本文以句子为出发点对网
Internet为商业服务提供了开放、通用、标准的信息基础设施,并由此形成了新的商业模式,例如E-services,E-commerce,B2B,B2C,C2C,Virtual Organizations等。有效发现和整合已
作为当今热门研究领域之一的无线传感器网络技术,由于其日益成熟的技术和广阔的应用市场,越来越受到诸多关注。IEEE 802.15.4是一个低数据率的WPAN(LR-WPAN)标准,具有复杂度