MP3编解码对音频水印信号影响的研究

来源 :电脑迷 | 被引量 : 0次 | 上传用户:lhihxk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 MP3已经成为数字音频的主流压缩编码。本文从实验出发探讨了MP3编解码对时域和频域两方面影响,重点分析MP3编解码对水印信号的影响,基于此得出针对时域变化采用载体信号和重采样划分来实现嵌入与提取同步,通过量化相邻子帧低频能量比来嵌入信息以消除频域失真。
  关键词 MP3 音频水印 同步机制
  中图分类:TP393 文献标识码:A
  0引言
  随着数字音频技术的发展,水印技术得到越来越多的研究与关注。由于人类听觉系统(HAS)极为灵敏,音频感知冗余较小,水印同时满足隐蔽性和鲁棒性条件的困难较大,音频水印的研究相比较于图像水印更具有挑战性。
  1MP3音频水印
  现有MP3音频水印算法大致可以分为两类:一类为压缩中和压缩后嵌入,其实质是通过修改MP3的编码中的感知非敏感信息来嵌入秘密信息,可以获得较好隐蔽性和较大的嵌入容量,MP3Stego隐写工具就采用了这种方法但是这类算法只是“躲过”了有损压缩,本身并不能抵抗MP3压缩算法。另一类为压缩前嵌入,一般通过修改频域嵌入来获得较好的鲁棒性。此类算法都缺乏变采样率MP3编解码测试,对MP3攻击的测试也较简单,码率设置较高,压缩比较低,或者不说明压缩参数,无法证明其同样适用于高压缩比的MP3编码;且水印算法设计仅考虑了有损压缩带来的波形失真,嵌入与提取缺乏相应的同步机制虽然在音频水印系统中引入了同步信号,缺点是所用的算法对音频能量幅度的变化非常敏感,不适合压缩编码。本文采用多种MP3工具分析了编解码后信号时域和频域的变化,根据编解码前后低频能量的稳定性,通过量化相邻子帧低频能量之比比较对水印信息的影响,然后对每一帧进行了不可感知性评价。
  2MP3编解码对音频信号的影响
  原始音频信号经过MP3编解码后在时域和频域都发生了改变,时域变化主要受编码器影响,频域失真则与压缩采用的码率和采样频率有关。实验用原始音频都为从CD抓取的wav格式音频,44.1kHz采样频率f下文中如不特别声明,原始信号采样频率默认为44.1kHz),16bit精度,MP3工具包括了Co0ledit2000Pro,iTunes,MP3 Audio Converter,Win amp Prov5.34。
  2.1时域变化
  任意截取长度为0.5s的原始音频片段用Cooledit2000Pro经过128kbps,44.1kHz的MP3编解码后音频时长从O.58变为0.574s,前面增加1635个样点。这些增加的样点大部分为零值点,少量为头尾帧边缘效应数据。MP3编码时采用的MDCT为正交重叠变换,头尾帧变换时需补零,从而产生边缘效应,MP3编解码后这部分数据也被加到音频中。这里把前后增加的样点分别称为前边缘信号和后边缘信号,而把中间的样点称为有效信号。前边缘信号长度与后边缘信号大致相等,边缘信号长度与MP3编码器有关,是不同的MP3编解码工具音频的前边缘信号样点个数。经过MP3编解码后进行水印提取时,由于边缘信号的加入,嵌入位置在时域上已经改变,须要进行重定位。若有效信号本身的开始或者结尾就为一系列零值样点,那么经过MP3编解码后这些有效信号的零值样点会与边缘信号混淆,更难确定时域的提取起始点。
  2.2频域失真
  MP3编码是一种有损压缩,将每帧样点分为等宽子带,每个子带根据心理声学模型计算信掩比,再根据编码码率进行比特分配,得到量化因子,最后对MDCT系数进行量化和Huffman编码。若进行变采样率MP3压缩,还会对信号进行减采样。MP3编码主要是利用声音的频域掩蔽效应,使量化噪声处于频域的掩蔽阈值之下,去除了音频中的感知冗余成分,包括一些能量很小的频率成分。低频(<3kHz)部分集中了音频信号大部分能量,可感知的频率成分最多,虽然掩蔽阈值较大,但信掩比(signal-to-mask ratio,SMR,表示信号声强与最小掩蔽阈值之比1相对较大,所以低频能量经过MP3编解码后失真很小。反之高频(>10kHz)部分能量很小,可感知的频率分量也相对较少,虽然掩蔽阈值较小,但信掩比相对较小,高频能量经过MP3编解码后失真较大。如果采用变采样率MP3编解码,随着采样频率的降低,高频部分损失会进一步增大。随着编码码率和采样频率的降低,压缩比增大,高频能量失真幅度也显著增大,而低频能量失真很小且几乎稳定。由此可见,经MP3编解码后,10k以上频率能量变化幅度最大可达到33.24%,而3kHz以下频率能量变化幅度最大只有4.19%。更多实验显示,若音频信号本身能量较大且高频成分丰富,例如~段节奏很快的摇滚乐,经MP3编码后,10kHz以上频率能量变化幅度最大可以超过90%,而3kHz以下频率能量变化幅度仍然不超过4%。故音频的低频能量对MP3编解码具有很好的鲁棒性。
  3结束语
  本文主要分析了MP3编解码对于水印的影响,通过分析如果在原始音频中嵌入水印再编码,这种水印在采样和量化环节的失真比较严重,故在低频中嵌入水印有更好的鲁棒性。
  参考文献
  [1] Katzenbeisser S,Fabien A Petit colas P编,吴秋新,钮心忻,杨义先,罗守山,杨晓兵译,信息隐藏技术—— 隐写术与数字水印.北京:人民邮电出版社,2001:104—105.
  [2] 刘伟,王朔中,张新鹏一种基于部分mp3编码原理的音频水印.中山大学学报(自然科学版),2004年,43增刊(2):26—33.
  [3] 项世军,黄继武,王永雄.一种抗AD/DA变换的音频水印算法.计算机学报,2006年,29(2):308—316
其他文献
摘 要 随着计算机技术的发展以及互联网的普及,我国目前已经拥有庞大的互联网网民,计算机网络已经影响到生活的方方面面,其中许多业务与国际接轨,诸如电信、电子商务、金融网络等。网络安全问题已成为影响国家全局和长远利益的急待解决的重大关键问题。目前我国计算机安全存在计算机核心技术水平尚待提升,网络安全管理混乱,网络安全意识淡薄等问题,需要政府加强管理,健全相关法规,形成自己的网络安全体系。  关键词 网
城市就是一个耗散结构,它需要从外界输入食品、燃料和原材料,同时也输出产品和废物,这样才能生存下去,保持一定的稳定有序状态,否则就会趋于混乱,乃至消亡。
摘 要 本文主要从医学院网络建设的需求分析、医学院网络建设目标、组网技术要求、网络设计要求、方案整体设计、网络设备选型、设备配置、网络规划、网络计费与服务系统到医学院网络应用系统等方面进行了比较详细的分析与描述,对准备建设医学院网络和进行网络升级的学校具有一定的参考价值。  关键字 网络设计 网络设备 交换技术 医学院网络应用系统  中图分类号:TP3 文献标识码:A  1需求分析  医学院网络必
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
摘 要 本文分析了造成多校区高校排课困难的各种因素,研究了如何应用遗传算法来解决多校区高校排课困难的问题,并对该算法进行详细设计,给出了一个基于该算法的排课模型。  关键词 遗传算法 排课系统 教务管理  中图分类号:G71 文献标识码:A  排课问题是一个多约束、多目标的优化问题,是教务管理工作的一个重点和难点。尤其是多校区同时运行的高校格局增加了更多的约束条件,问题的复杂度也增加了许多。多校区
摘 要 数据压缩可以去除数据中的冗余信息,减少数据的存储量,同时也可以减轻网络负担。本文介绍了目前最常用的几种数据压缩的方法,包括预测编码技术、时间序列线性拟合技术、DCT变换、DWT变换和压缩感知。  关键词 数据压缩 预测编码 压缩感知 小波变换  中图分类号:TP393 文献标识码:A  0引言  数据压缩技术一直是一个热门研究领域,其作用是去除数据中存在的冗余信息,以不影响数据内容为前提,
摘 要 目的:本文构思出了一种新的血液引流模型,此设计用于维护终末期肾功能衰竭患者血液透析并在透析过程中使血液流动保持动力学稳定状态并将血流量增加到约400毫升/分钟。基于神经网络专家系统的工作机理的解释。方法:首先,设计了一种新的结合血液引流机的透析壶;第二,根据血流动力学可操作条件的分析,建立了三层BP神经网络;第三,对神经网络专家系统的知识获取和表达进行了详细研究;最后,对神经网络专家系统进
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊