低信噪比下的语音端点检测技术的研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:philiploo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,现在社会出现越来越多的电子设备,难识别的电子设备也出现了,要想将正确的语音信号转变成语音信息,尤其是在一些有噪音的环境下,包括高噪音和低噪音,要想识别出想要的语音信息,必须要有高端的识别方法,然而语音端点检测技术又是语音识别技术中的关键部分,其在语音的编码、语音识别、语音增强、说话人识别中起着非常重要的作用,直接影响着后续工作的进行。现有的语音端点检测方法在高信噪比环境下具有很好的检测效果,但是随着噪声的增强,其检测性能都有很大程度的下降,有些方法因此而失效,因此研究低信噪比环境下的语音端点检测方法意义重大。本论文首先介绍了语音信号识别的过程和端点检测过程,然后按照时域特征、频域特征、非线性特征、多特征等一系列特征介绍了常见语音端点检测方法,给出了常用方法基础知识和部分仿真数据实验与分析,为低信噪比下语音端点检测方法的改进提供理论基础。其次改进了基于时域和频域完美结合的算法即短时能量过零率和功率谱熵结合的端点检测算法,并将其运用到拨号音的识别中,如银行卡卡号、密码、手机号中,同时借助Matlab工具对录制的拨号音进行端点检测,并进行频谱分析,最后得到识别结果,发现室外低信噪比环境下改进后的检测方法明显优于原来的方法即短时能量过零率和功率谱熵结合的检测效果比短时能量过零率的检测效果好,其识别率达到92%以上。针对拨号键端点检测识别中,对其起止点和结束点或更低信噪比环境下语音识别不准确的问题,我们必须要对以往的方法进行继续改进,这部分是我目前正在研究和发展的内容。
其他文献
本文主要应用极小极大方法和Morse理论研究双调和方程的超线性问题 {△2u+c△u=λu+f(x’u),x∈Ω, (0.1) △u=u=0, x∈аΩ, 的多解存在性,这里△2是双调和算子,Ω是RN中具
学位
对于奇素数p,本文给出了非交换子群的中心均相等的有限p群的完全分类。