论文部分内容阅读
目的:研究安静、噪声环境中不同频段的时域包络(temporal envelope,TE)信息在汉语普通话言语识别中的作用。方法:安静环境中,将普通话版噪声下听力测试(Mandarin hearing in noise test,MHINT)材料进行频谱分析,从低频至高频(80-7562Hz),分割为30个频带,每个频带的宽度为1个等效矩形带宽(equivalent rectangular bandwidth,ERB),每个频带内通过Hilbert转换提取其中的TE信息,将提取的TE信息合并为5个频段(频段1:80-502 Hz;频段2:502-1022 Hz;频段3:1022-1913 Hz;频段4:1913-3856 Hz;频段5:3856-7562 Hz);噪声环境中,将MHINT材料与4 Hz调幅噪声以信噪比(signal to noise ratio,SNR)为+5 dB进行合成,其余同安静环境下的信号处理。分别测试听力正常受试者不同条件下的言语识别率,并根据不同条件下的识别率,利用最小二乘法计算每个频段在普通话言语识别中的相对权重。结果:安静环境中,频段1在言语识别中的相对权重约为0.25,显著高于所有其他频段的相对权重;频段3的相对权重显著低于频段1,但显著高于其他频段,约为0.22。噪声环境中,频段1在言语识别中的相对权重最高,约为0.46;频带2、频带3在言语识别中的相对权重分别约为0.24,0.22,差异无统计学意义,但都显著高于频带4和频带5的权重。结论:不同频段之间的TE信息具有协同效应。安静与噪声环境中,频段1(Region1:80-502 Hz)的时域包络信息在普通话言语识别中的作用均最为重要,但噪声环境中频段1在言语识别中的相对权重要高于安静环境中频段1的相对权重。