喉振式话筒语音的修复研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:liongliong557
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
喉振式话筒是放置在喉部附近的皮肤振动传感器,是一种典型的非空气传导语音的设备。由于它采集不到外界空气传播的噪声,它被广泛应用于各种强噪声环境下的语音采集。但由于喉振话筒采集的是通过肌肉、皮肤等的振动传播的语音,它与传统的采集通过口腔等声道传播的近讲语音相差较大,表现为喉振话筒采集的语音发闷、含糊不清,特别是清音几乎听不到,使得喉振语音的可懂度较差,这限制了喉振式话筒的推广使用。本论文的主要工作就是提高喉振式话筒采集语音的可懂度和自然度,使它听起来更符合人类的听觉。本文提出了基于神经网络的语音转换方法进行喉振语音音质改善。首先分析了喉振语音的声学特征和谱特征,得出喉振语音与近讲语音的主要差别在于声道传输部分。因此只要修改表征喉振语音声道传输函数的特征参数即可,修改方法可采用语音转换的方法。通过比较倒谱系数、线谱对频率、Mel倒谱的声学特性,得出Mel倒谱由于其充分利用了人耳的听觉特性,按Mel频率分区,并通过离散余弦变换去冗余得到正交参量,故Mel倒谱是表征喉振语音较好的特征参量。通过比较基于高斯混合模型的语音转换和基于神经网络的语音转换方法,得出基于神经网络的语音转换方法要优于基于高斯混合模型的语音转换方法。最后得到适用于喉振语音音质改善的语音转换算法。分别提出喉振语音的Mel倒谱参数和近讲语音的线谱对参数,作为神经网络转换的源、目标的特征参量,神经网络采用尺度共轭梯度SCG算法加快训练,得到最优的非线性映射模型。转换时将喉振语音输入到已得到的映射模型中得到音质改善的转换语音。通过对转换音的音质主观评价和客观评价,得出本算法能较好的提高喉振语音的音质。本研究可推广应用到强噪声环境下喉振话筒采集的语音中,可提高语音的可懂度,增强音质。
其他文献
LTE系统是为了解决移动通信技术更好的融合无线宽带接入方案而提出的新一代的无线通信系统。它上行支持单载波频分多址的接入技术,下行支持正交频分多址接入的技术,同时支持
计算机外设和数码产品的不断发展,使得各种设备之间的接口和互连成为当前亟待解决的问题。USB是现今PC机总线中应用最广泛的接口技术。在USB拓扑结构中,PC机居于核心地位,USB
本文依据中国空气动力研究中心与西南科技大学联合基金项目的要求,进行多点微动测控技术及无线测控网技术的研究。   本文将微动测控技术与无线测控网技术相关联,尝试将现代
本论文课题来源于山东大学信息科学与工程学院无线移动通信与传输实验室袁东风教授承担的山东省自主创新成果转化重大专项“低成本、低耗能、高可靠嵌入式终端与信息服务平台
随着现代无线通信业务的快速发展,人们对更高速率和更好质量服务的要求和日益紧张的无线频谱资源之间的矛盾越来越大。多输入多输(MIMO)技术已被证明能在不增加带宽和发射功
在现代电子设备中,印刷电路板PCB发挥着越来越重要的作用,其质量的好坏在一定程度上决定了电子产品的性能。因此,PCB缺陷检测在工业生产中具有极其重要的价值。基于自动光学
随着信息产业的飞速发展,通信网络、广播电视网络与IP网络三网融合进程的快速推进,多媒体业务正成为网络的主要业务之一。多媒体业务数据传输量大,如何有效地利用信道带宽,成为运
网络多媒体技术、通信技术和传输技术的迅速发展给人们带来极大的便利的同时,信息安全成为人们不容忽视的问题。而无线网络因为其特殊的性质,安全问题尤其突出。加密哈希函数
结构化LDPC(Low-Density Parity-Check,LDPC)码是一种逼近香农限的实用好码,工程中通常用结构化的方法进行构造。而准循环LDPC(Quasi-Cyclic LDPC,QC-LDPC)码因为其校验矩阵