基于动态环境自适应端点检测的语音识别系统研究

来源 :武汉理工大学 | 被引量 : 7次 | 上传用户:zhangtianyu66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号是人类传播信息和感情交流的重要媒体,是听觉器官对声音传媒介质的机械振动的感知,也是人类最重要、最有效、最常用、最方便的通信方式。语音信号处理是信息科学研究领域中目前发展最迅速的学科之一,其研究涉及众多前沿课题。端点检测是语音识别中的一项关键技术。现阶段的各种端点检测算法在信噪比较高时检测性能均较好,但随着信噪比的下降各算法性能都明显下降,且目前算法大多没有自我学习能力,在信号噪声发生大幅度变化时往往失效,无法适应充斥实际生活中室外各种复杂的噪声环境。本课题主要针对实际生活噪声环境下的孤立词语音识别,研究能够动态适应环境的语音识别系统。实际生活环境中的噪声往往以高斯白噪声为主,且环境经常变化。高斯混合模型(GMM)能够描述复杂的随机量,且具有很强学习能力,能够动态自适应随机量分布的变化。本文用高斯混合模型来描述环境中的背景噪声,并通过对高斯模型和噪声特性的分析,研究了基于高斯混合模型的端点检测算法,详细阐述了该算法流程。对语音识别其它模块的算法进行了研究,选择了相应的优化算法,包括语音增强、特征提取以及模板匹配模块,研究了各模块的设计方案。通过对语音识别系统各个模块的研究,最后组成了一套完整的能够动态自适应环境的语音识别系统并对系统识别性能进行了仿真实验。本系统主要针对复杂环境下的孤立词识别,在环境发生改变时能够进行自我学习更新,无需人为干预。但在环境噪声发生较大突变时学习速度有限,需要较长时间来适应突变后的噪声环境;另外系统整体的计算量较大,识别速度有限,在实时性方面仍有待改进。
其他文献
随着合成孔径雷达的不断发展,其在国防工业和民用领域的应用越来越广泛。为了更加充分地发挥SAR全天时、全天候、远距离、高分辨率、广域观测的特点,实际应用中,对SAR的分辨
在现代社会中,身份认证作为保护信息安全的一种方式,在国家安全、金融、司法、电子商务等应用领域都显得尤为重要。传统的身份认证方法(如钥匙、口令等)已不能满足社会的需要
近年来,随着通信产业与互联网络的迅猛发展,以及人们生活节奏的进一步加快,无线移动应用逐步深入人心。3G网络的全球广泛部署进一步为3G业务以及新型移动互联网的发展打下了
目前,多入多出技术(Multiple-input multiple-output ,MIMO)与正交频分复用技术(Orthogonal Frequency Division Multiplexing,OFDM)已被采用为下一代无线城域网标准(IEEE 80
深空探测是在卫星应用和载人航天取得重大成就的基础上,向更广阔的太阳系空间进行的探索。随着21世纪的到来,深空探测技术作为人类保护地球、进入宇宙、寻找新的生活家园的唯一
无线传感器网络是由大量计算、通信及存储能力有限的传感器节点组成的特殊网络,在军事和民用领域具有广泛的应用前景,是目前一个非常活跃的研究领域。数据查询是传感器网络中
航天相机是航天探测领域重要的遥感器,它分为航天侦察相机、航天测绘相机等多种类型,在民用、军事等方面也有着相当广泛的应用。在测试航天相机的性能时,需要将其产生的图像
认知雷达因其能适应日益复杂的检测环境,自提出以来,即受到全球范围内的关注。认知雷达具有从接收机到发射机的信息反馈机制,利用所感知的信息以及其他先验知识,对发射机和接
说话人语音转换是为了实现合成语音中的说话人的多样性而产生的语音信号处理的一个新兴的方向,说话人语音转换在很多的领域有着广泛的应用,如军事上的说话人伪装、机器翻译、医
基于X射线脉冲星的相对导航系统因其自主性好、可靠性高及适用性广等优点,与现有的导航系统形成优势互补,是一种全新的自主导航方法,正逐渐受到航空航天领域的高度重视和青睐