基于ARM A8和矢量泰勒级数特征补偿的语音识别系统实现与优化

来源 :东南大学 | 被引量 : 0次 | 上传用户:simon_186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着语音识别技术和嵌入式系统的发展,基于嵌入式系统的语音识别技术被广泛运用到汽车、智能玩具、工业控制等领域。基于语音的人机交互更加自然、便利,以及嵌入式系统低成本、小体积、低功耗的优势,因此实现鲁棒的嵌入式语音识别系统具有重要的应用价值。本文主要研究基于矢量泰勒级数特征补偿的嵌入式孤立词识别系统的优化,通过优化提高系统的识别速度,实现系统的实用性。主要工作如下:1、研究了语音识别系统的结构、性能评价指标和预处理技术。本文采用基于谱熵的双门限端点检测算法,选择梅尔倒谱系数和对应的一阶差分系数作为系统的语音特征参数,选择隐马尔科夫模型作为系统的声学模型,采用基于矢量泰勒级数的特征补偿算法。2、根据ARM A8硬件平台特性、C语言特点对孤立词识别系统进行的优化。改变程序中变量的数据类型,达到利用浮点协处理单元NEON完成浮点运算的目的;调整程序结构来提升程序的可读性,便于后期维护;优化代码以及离线计算部分变量,提升程序的执行效率,加快系统的识别速度。最后在硬件平台实时测试优化后系统的误识率及识别速度。3、研究基于语音识别算法层面的优化。分别利用Fisher比准则对语音特征参数进行降维、利用最近邻估计法减少Viterbi算法的运算量以及减少矢量泰勒级数特征补偿算法中高斯混合模型的混合数。首先基于MATLAB平台,在不同噪声环境下进行分析测试。在MALTB仿真测试基础上,基于ARM A8平台实现了算法层的优化,并实时测试优化后硬件系统的误识率和识别速度,测试结果表明了优化方法的有效性和可靠性。
其他文献
图像质量的评估主要由点扩散函数(PSF)进行,主瓣宽度、旁瓣电平是两个最重要的评估标准。医学超声成像系统中比较核心的部分是波束形成器。波束形成包括发射波束形成和接收波
在无线信道中实现可靠、高速的数据传输是无线通信的目标和要求。正交频分复用(OFDM)技术具有抗多径时延、抗信道衰落、频谱利用率高等优点,近年来受到广泛关注。在OFDM系统
随着国家对于食品溯源体系建设的日益重视,商务部“肉类蔬菜流通追溯体系”正在紧锣密鼓的开展中。溯源秤作为集计量称重、打印凭证、无线通讯、电子结算、数据上传为一体的
本文主要研究和设计了一种基于混合信任机制的P2P流媒体直播模型。传统的P2P流媒体应用在很大程度上改善了网络流媒体的性能,但与之俱来的是P2P网络带来的安全性问题。原因在
大气湍流会使在大气中传播的光波波前发生波平面任意畸变、强度随机抖动和光束扩散等现象,从而影响观测系统的成像质量,自适应光学波前处理技术可以很好地克服这些问题。自适
极化敏感阵列是一种能够敏感到电磁信号极化信息的阵列,和普通阵列相比,它具有较强的抗干扰能力、稳健的检测能力、较高的分辨率以及极化多址等优点,故在雷达、通信、导航等
随着信息技术的不断发展,人们对多媒体信息服务的要求越来越高,已不再满足于被动地接受多媒体信息,而希望能够对自己感兴趣的多媒体数据进行交互,第一代视频编码算法H.263、M
最近几十年以来,医学超声成像领域发展迅速,涌现出了一大批具有突破性意义的新技术,新方法,其中很有代表性的一个就是多普勒超声成像技术。与其它医学成像技术如x光、核磁共