论文部分内容阅读
封闭空间声学指纹是指代表该封闭空间几何属性与声学属性的各种声学参数的集合,是音频文件的天然水印,可以应用于版权保护、司法、刑侦、反间谍、反恐等方面。如果能够从获得的音频信号中提取录音现场的空间声学指纹,进而推断出录音现场的环境特征,这将对音频文件真伪的鉴别、案件的侦破与判决起到重要的指导作用。通过研究封闭空间声学指纹的构造,以及它与录音环境的建筑规模、内部环境以及声学特性之间的关系,进而可实现只根据一段音频信号来推断录音现场的环境特征。封闭空间冲激响应函数不仅反映了该空间的音响效果,更重要的是它包含了该空间几何属性与声学属性的信息,即建筑物的内部空间大小、结构及内部墙面的声学特性,因此可以由封闭空间冲激响应函数提取出构造封闭空间声学指纹的各种参数。在构成封闭空间声学指纹的各种参数中,最重要参数之一就是封闭空间的混响时间。本文在对封闭空间声学指纹构建可行性分析基础上,主要探讨混响时间的估计问题。由于冲激响应函数取决于声源和接收器的位置,那么施罗德方法中冲激响应函数估计的混响时间也将受到声源和接收器位置的影响。本文提出两种修正的施罗德混响时间估计方法,以消除声源和接收器位置对混响时间估计的影响。最后为了研究混响时间与封闭空间几何属性的关系,进行了仿真环境下的声学测试。