利用透射波提取语音特征参数初探

来源 :山东大学 | 被引量 : 0次 | 上传用户:tdcdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音识别过程中,声学模型的建立是语音识别的核心部分.目前的声学模型中的声道部分,普遍采用的是无损声道模型(也有人称为行波模型).在无损声道模型中利用流体力学的原理粗略的求解出系统的传递函数,这个传递函数是一个只含递归结构的全极点模型.然后运用线性预测(LPC)的方法求出线性预测系数来表征语音信号.但是,LPC有一个明显的缺点<[2][3]>,它基于的声道模型只是一个含递归结构的全极点模型,而实际上的声道传递函数应该采用自回归滑动平均模型,而不是简单的全极点模型因为声道响应都含有零点的影响.对于这种缺点,本文提出了一种全新的声道模型:基于透射系数的声道模型.本方法利用了物理学中声波在介质中的传播的性质.而不是传统的利用流体力学声管模型的方法.声音是由振动源引起的.在求解透射系数与反射系数时必须要解决两件事.首先,应该滤除掉语音信号中的高频干扰,因为高频成分会掩盖许多有用特征信号.第二,必须要找到声门激励和实际测到的声音信号的对应点,以便正确的求出透射系数与反射系数.在本文中,利用了数字信号处理的最新技术-小波分析,将这两件事一并解决.小波分析作为一种新的时频域兼顾的分析手段出现在1984年,在此之后,小波变换作为信号处理的一种手段,逐渐被越来越多领域的理论工作者和工程技术人员所重视和应用,并在许多应用中取得了显著的效果.同传统的处理方法相比,小波分析产生了质的飞跃.作为一种调合分析方法(兼顾时域和频域),小波技术具有十分巨大的生命力和广阔的应用前景.由于小波分析的使用,使得求取基音周期变得非常简单,并能够非常容易得找到清音和浊音的结合点(特征点).而且通过小波变换可以有效地将语音信号中的高频成分滤除掉.将经过小波处理后的语音信号作为实际要参与计算的输出信号,利用Rosenberg函数构造的三角波脉冲,作为要参与计算的输入信号.从而可以计算透射系数和反射系数.但是由于计算透射系数和反射系数非常的复杂,所以又根据透射系数和反射系数构造了一个新的特征变量.它是透射系数和反射系数的函数,当然也能够描述声道的变化.将这一新的特征变量最终用于语音识别,并能够取得预想的效果.
其他文献
随着信息时代的飞速发展,微博作为一种新型媒体介质出现,吸引了大量真实的优质用户。微博是一种基于用户关系的信息分享、传播以及获取的平台,具有信息发布快及传播迅速的优
流媒体是一个全新的概念,它是一个开放的还没有标准化的框架.在这个框架中,它包含用于传输数据的实时传输协议(如RTP)和用户建立会话的信令协议(如RTST/SDP协议),另外再加上
该论文详细研究了基于高斯混合模型(GMM)及其改进模型的无文本说话人识别系统.该论文完成的工作有:(1).建立了一个包括30个说话人的语音库.(2).完成了语音特征MFCC的提取,讨
该文主要就多Agent分布式入侵检测系统中通信机制和数据分析方法进行研究,并在此基础上设计实现了一个具备分布式入侵检测系统基本功能的原型系统.该文首先就Agent通信模型展
嵌入式系统无所不在,它几乎包括了我们周围的所有电器设备.大部分传统的嵌入式系统都是孤立的单一系统,但在网络日益重要的今天,越来越多的嵌入式系统有了联网的要求.嵌入式
本文的内容主要分为四部分.文章的第一部分主要介绍VPN的协议及其原理.首先介绍了VPN用到的最关键的技术——安全隧道技术.然后介绍了数据链路层实现隧道技术的PPTP、L2TP协
概率图模型是计算机视觉、模式识别、自然语言处理和生物信息等领域中极为重要的结构化数据建模处理工具,MAP推理是概率图模型中最为关键的瓶颈问题之一,也是概率图模型中的
利用移动通信技术和计算机及INTERNET技术,从而提高短信业务的发展的多种经营方式正是本文所要探索的目标。本文主要介绍GSM短消息业务、网络实现协议结构和实施方式,并分析、
我们的数据库系统是国家数字图书馆项目的XML元数据存储和查询的一部分.XML数据往往海量,实际中又需要对其进行复杂的查询,查询的响应时间一般要求在用户交互的级别上,这样,
中国养猪业经过了三十多年的发展,伴随着国内、外规模化养猪技术的推广和应用,我国的猪场生产水平也有了一定程度的提高。但是,目前我国的养猪技术仍然低于国外先进水平,规模化养