基于空间分离和丟失数据的语音识别算法研究

来源 :东南大学 | 被引量 : 2次 | 上传用户：yttgfnm

【摘要】

：

目前常用的鲁棒语音识别研究主要是基于测试环境和训练环境的失配问题提出的,例如鲁棒语音特征参数提取、特征补偿和模式自适应的方法,这些鲁棒性算法的研究出发点都是要保证

【作者】

：

赵一良

【出处】

：

东南大学

【发表日期】

：

2017年01期

【关键词】

：

语音识别丢失数据技术语音特征参数边缘概率基于状态的数据估计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前常用的鲁棒语音识别研究主要是基于测试环境和训练环境的失配问题提出的,例如鲁棒语音特征参数提取、特征补偿和模式自适应的方法,这些鲁棒性算法的研究出发点都是要保证测试特征参数和训练特征参数模型的一致性。而人耳听觉系统的语音信号处理系统具有较强的鲁棒性,能够在极其嘈杂的声学环境下实现准确的语音感知和识别。相关研究指出人耳听觉感知过程可以分为两个阶段:第一,声学信号的切分(segmentation)过程,第二,属于同一声学目标的感知成分的组合(grouping)过程,从而形成不同声源连贯的数据流(coherentstream)。也就是说听觉系统的感知过程,实际上是听觉场景中不同声源信号的重组织过程,混合声信号中属于同一声源的分量组织到一个数据流中,从而得到不同声源的数据流,使得人耳的听觉系统可以区分不同的声源。在此基础上,再进行进一步的处理。因此从人耳声信号处理的机制出发,我们对基于语音分离的鲁棒识别方法进行研究。考虑到由于基于方位信息的语音分离与语音信号内容、说话人无关,同时基于空间方位信息的语音分离无需建立源信号参数的统计模型。由于空间分离后,特征参数存在数据丢失的问题,因此本论文将基于空间分离的语音分离方法和基于丢失数据的语音识别方法进行了结合,提出了融合空间方位分离和丢失数据的孤立词识别算法。本论文的主要工作如下:(1)对语音识别系统的基本结构进行了概述,包括预处理、特征提取与HMM语音模型。具体分析了现有鲁棒语音识别技术在信号空间、特征空间与模型空间所包含的代表性的技术。并由此引入本文的重点研究内容:基于丢失数据的语音识别技术。(2)分析了现有鲁棒识别系统经常使用的语音特征参数,包括倒谱域中的梅尔倒谱系数(MFCC)和线性预测倒谱系数(LPCC)。基于丢失数据技术的基本原理,本文研究了另外两种频域中的参数:基于梅尔滤波器组的FBANK参数和基于Gammatone滤波器组的子带RateMap参数,并基于HMM通过Matlab进行仿真测试,实验表明,这两种参数可以应用于基于丢失数据的语音识别系统之中。(3)实现了基于空间分离和丢失数据技术的语音识别系统。基于空间信息的语音分离算法基于语音信号的稀疏性生成不同声源的二元掩膜,这种判决方式会产生目标声源频域成分丢失的问题。本文研究了两种算法对丢失的数据部分进行处理。一种是完全忽略数据的丢失部分,仅使用未丢失的数据进行语音识别,即边缘概率技术。另一种是通过特定的方法恢复数据的丢失部分,得到完整的数据用来进行语音识别,即数据估计技术。仿真实验表明两种技术在低信噪比下识别性能有显著提升。

其他文献

纯化油田纯4-5组薄隔层压裂技术研究

纯化油田主力开发的纯1-3组进入中高含水期,需要通过压裂开发其下部的纯4-5组储层,使油田保持持续稳定生产。论文针对常规的压裂井裂缝穿透隔层容易造成压裂失败的问题,对纯

学位

纯化油田低渗透薄互层压裂

基于固体废弃物的益生菌混合发酵及其对土壤微生态的作用机制研究

本文首先从不同地域的土壤中筛选出真菌、细菌共计146株,并以8株植物病害菌为指示菌株,采用平板对峙法进行病害拮抗菌株筛选,获得抑菌效果显著、抑菌谱广的株菌三株,经分子生

学位

益生菌固体发酵混合发酵DGGE

基于认知冲突理论的高中现当代散文教学研究

现当代散文是高中语文教材中的主导文类。它形式自由,语言优美,情感真挚,是文质兼美的典范。现当代散文教学一直是高中语文教学的重难点。但是,由于种种原因,现当代散文的教学现状并不乐观,出现了诸多问题,致使学生的语文核心素养难以在其中得到培养和提高。随着新课程改革的深入,认知冲突问题开始引起教育界关注,其对教学的价值亦日益凸显。在高中现当代散文教学中,科学、合理地利用或化解认知冲突,可以优化学生的认知结

学位

高中现当代散文教学认知冲突

移植过表达SDF-1α的骨髓间充质干细胞治疗大鼠脊髓损伤的实验研究

目的在课题组前期的BMSCs体外迁移研究基础上,通过建立SCI大鼠模型,观察过表达SDF-1α的BMSCs向脊髓受损区域的迁移情况,同时观察SCI后大鼠的双后肢运动功能的恢复情况及对受

学位

骨髓间充质干细胞脊髓损伤SDF-1α迁移

非线性梁非线性能量阱振动控制与能量采集

非线性梁在工程中的应用越来越常见,它广泛存在于航空领域中,比如具有大展弦比的机翼等。对于这种非线性梁结构,不实施有效控制,引发的振动会对结构稳定性以及工作精度带来巨

学位

非线性梁振动控制与能量采集非线性能量阱压电-非线性能量阱装置超磁致材料-非线性能量阱装置

“过”的历时语义地图研究

“过”是典型的“异类多义”词,即在这一词形下存在多个相互联系但属于不同语法范畴的义项,其异类多义性引起了许多语言学家的关注。虽然前人已经对其语义以及语法化做了详细研究,但从语义历时演变以及跨语言比较两个角度出发对其异类多义性进行的系统研究几乎没有看到。基于此,本文拟在语言类型学的视角下运用语义地图模型对“过”的历时语义演变进行研究。语义地图模型是表征跨语言的语法形式-语法意义关联模式的差异与共性的

学位

“过”历时语义地图语义演变跨语言比较蕴含共性

用于医学图像隐私保护的集成加密模型

随着计算机断层扫描(CT)、核磁共振(MR)等医学影像设备的迅速发展,影像设备在医院对癌症等重大疾病的临床诊疗过程中应用更加广泛。在医院里,医务工作者频繁地利用影像数据来

学位

医学图像加密隐私保护选择性加密时空混沌

CMTM3通过抑制上皮细胞—间充质转化影响结直肠癌的预后

背景:结直肠癌(colorectal cancer CRC)是最常见的恶性肿瘤之一,是全球致死性肿瘤中排第三位。肿瘤的转移及复发是结直肠癌患者预后不良的主要影响因素,而肿瘤细胞获得侵袭能

学位

结直肠恶性肿瘤CMTM3E-cadherinVimentin上皮间质转化

TRIM5α对PRRSV抑制作用及其机制的研究

猪繁殖与呼吸综合征病毒(Porcine reproductive and respiratory syndrome virus,PRRSV)可引发猪繁殖与呼吸综合征(Porcine reproductive and respiratory syndrome,PRRS),引

学位

猪繁殖与呼吸综合征病毒TRIM5αNsp1αNsp1β

基于动力特性的钢筋混凝土柱火灾损伤识别理论分析与试验研究

近年来,基于动力特性的结构损伤诊断方法已经成为土木工程学科十分活跃的研究新领域,许多研究成果已经成功的应用到实际工程中并取得了良好的效果。目前国内外关于钢筋混凝土

学位

钢筋混凝土柱火灾Timoshenko梁模型动力损伤识别COMAC值

基于空间分离和丟失数据的语音识别算法研究

其他学术论文