基于音节的汉语连续语音声调识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：cosmos_lin

【摘要】

：

声调是汉语的主要属性之一，具有构词、辨义和提高表达效果等功能，对语音识别、语音合成和自然语言理解有重要意义。近年来，自动语音识别研究取得了突破性的进展，出现了许多不

【作者】

：

钟金宏

【出处】

：

合肥工业大学

【发表日期】

：

2001年期

【关键词】

：

音节分割基频检测特征提取声调模式声调识别汉语连续语音三字词分形理论波形互相关性小波变换模糊自适应谐振理论映射

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声调是汉语的主要属性之一，具有构词、辨义和提高表达效果等功能，对语音识别、语音合成和自然语言理解有重要意义。近年来，自动语音识别研究取得了突破性的进展，出现了许多不同类型的语音识别系统。语音识别研究也转向了大词汇非认人连续语音识别和自然语言理解。现有的汉语语音识别系统基本上没有利用声调信息，声调识别研究也多限于孤立字和多字词的声调识别，连续语音的声调模式和声调识别研究很少，本文在这方面开展了一点工作。汉语连续语音的声调识别比孤立字和多字词的声调识别更困难，本文提出了基于音节的声调识别思想，研究了其中涉及的音节分割、声调获取、特征提取、声调模式分析和声调识别模型等问题。论文的主要内容如下：（1）利用分形理论和波形互相关性研究了汉语连续语音中的音节分割问题。本文选音节做声调识别基元，这将引入音节切分问题。连续语流中的音节分割是非常困难的。本文根据语音信号的混沌本质，利用分形理论研究了汉语连续语音中的音节分割问题，提出了基于方差分形维数的音节分割方法，并详细分析了该方法的性能，它能很好地解决了无声与有声、浊音与清音间的分割问题，但很难解决浊音间的分割问题，当浊音相连且过渡段较短时，该方法无法实现它们之间的分割。为解决浊音之间的分割问题，本文根据语音中过渡段与非过渡段语音波形的差异，利用波形互相关性进行了研究，提出了基于波形互相关性的音节分割方法，并进行了实例分析。（2）基于小波变换的语音基频提取。声调是基频变化的模式，因此可通过基频提取来获取声调信息。基频提取的方法很多，本文采用了小波变换方法，该方法对部分语音得到了较好的结果，但对大部分语音提取的基频中含有较多错误，经仔细分析和研究，本文对它进行了改进，提出了一种基于小波变换的语音基频检测新算法。该算法根据基频点在小波变换的不同分辨率层具有传递性和在不同尺度上的基频点位置相似的特性，采用投票策略选择基频点。该算法主要有以下几步：计算在五个（或三个）尺度上的小波变换；运用投票机制进行基频点选择；基频检查；基频点的重新定位。（3）声调识别中的特征提取问题。特征提取是模式识别的基本问题。有效的特征既能反映模式的重要信息，又可减少计算量和误识率。汉语声调主要由基音曲线的调位高低和走向决定。因此，本文选择头尾差和相对调位比作为三字词音节的声调特征；选择头尾差和音节起点调位作为连续语音中音节的声调特征。合肥工业大学搏土论文扬耍（4）声调模式分析。连续语音中各音节的声调特征受前后音节的影响变化较大，声调模式更加复杂，仅具有四声的基本特征。正确地分析其中的声调模式和变调规则，对汉语连续语音的声调识别有重要意义。本文介绍了孤立字和二字词的声调模式，定性和定量地分析了三字词的声调模式，在此基础上研究了连续语音的声调模式。（5）声调识别模型的选择与设计。汉语连续语音的声调模式复杂多变，一个固定不变的识别模型不可能解决连续语音的声调识别问题。本文以具有在线学习能力的模糊神经网络作为声调识别模型，提出了基于模糊自适应谐振理论映射的声调识别方法。（6）用三字词和连续语音实例验证了所提出的思想和方法。论文中取得的研究成果如下：门）根据汉语的特点，提出了基于音节的汉语连续语音声调识别思想。（2）根据语音信号的混饨本质，提出了基于方差分形维数的音节分割方法；针对浊音间的分割困难，提出了基于波形互相关性的音节分割方法。（3）根据传统小波变换方法在基频检测实验中出现的问题，引入投票策略，提出了一种基于小波变换的基频检测新算法。（4）根据汉语声调曲线的特点，选择头尾差和相对调位比作为三字词各音节的声调特征：选择头尾差和音节起点调位作为连续语音中音节的声调特征。（5）定性和定量地分析了三字词的声调模式，印证了已有的三字词声调模式变化规律，得到了一些新的三字词声调模式变调规则。对汉语连续语音的声调模式，提出了以下观点：连续语音中的音节声调模式可以二字词和三字词的声调模式为基础：连续语音中的音节可认为仅受前后音节的彤响，一定间隙前后的音节声调可看成互不相关；连续语音中的音节声调模式可归为头、中和尾三类，通过对这三类声调模式的建模，可解决连续语音的声调识别问题。 ①）为了适应连续语音中的复杂情况，提出了以具有在线学习能力的模糊神经网络作为声调识别模型的观点。在此基础上提出了基于模糊自适应谐振理论映射的声调识别方法。

其他文献

浅析行政事业单位在会计核算中存在的不足与对策

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

行政事业单位会计核算不足对策

黄疸及进行性消瘦

期刊

阻塞性黄疽恶病质慢性胰腺炎胰头癌

浅析新课标下数学史在教学中的教育功能

从基础教育课程改革对数学与数学教育的定位来看,数学史具有激发学习兴趣,培养积极的情感和价值观;感受前人严谨态度,增强自我探索精神;了解祖国传统数学,培养学生爱国情怀;

期刊

新课标数学史教育功能

Logistics回归模型在重庆市房价中的预测与应用研究

前言随着近年来重庆市房地产市场的蓬勃发展和房价的逐步上涨,准确地预测未来房价涨跌趋势,对经济发展和老百姓的生活极其重要,同时也可以为经济决策提供参考.本文主要对重

期刊

^18F-FDG PET-CT在头颈部肿瘤复发及转移诊断中的应用与评价

目的研究正电子发射断层显像技术（^18F-FDG PET-CT）在头颈部肿瘤复发及转移诊断中的应用并对诊断效果进行评价。方法选取2011年5月—2012年5月我院收治的头颈部肿瘤患者40例,所

期刊

头颈部肿瘤复发转移正电子发射断层显像技术诊断Head and neck cancer recurrence metastasis positron e

为了每个孩子的音乐——对话黄美华

本刊编辑部:黄老师,您好。小学音乐教师是一个非常普通的岗位,您一干就是30年,而且干得有滋有味、有声有色。请您就“如何当一名优秀的音乐教师”谈谈自己的感想。黄美华:记

期刊

音乐教学文化语境编辑部音乐教师

对湿疹治疗的点滴经验

期刊

湿疹氯仿三氯甲烷甲烷

企业内部审计前沿问题研究

现代审计作为目前受托责任的一种有效的控制体系,其对企业而言所发挥的主要作用就是增值,在有效促进内部控制等防范企业的风险方面有着十分积极的意义,能够保障企业能够持续

期刊

基于音节的汉语连续语音声调识别方法研究

其他学术论文