汉语普通话声调识别和评估系统的设计与实现

被引量 : 0次 | 上传用户:jiwei5520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声调——汉语普通话最重要的信息,随着汉语语音识别技术的进一步发展,声调识别研究成为汉语语音识别技术突破的主要方向。而体现声调的最主要的特征就是声调的基频FO,有效的利用声调信息,必须对基频FO进行准确的提取与分析。为此,本文主要从基频提取以及基频后处理、声调识别建模、声调评估三方面对汉语普通话声调识别和评估系统进行了设计。首先,本文从声调特征基频FO的提取着手,采用短时自相关法进行汉语声调基频提取,由于基频提取中不可避免的会出现错误点,对提取后的基频进行后处理是必要的。基于此,本文采用了插值平滑和重采样处理获得用于识别模型的标准基频信息,并且改进了一种归一化方法(m LD算法),以便将其更好地应用于非特定人识别。依据语料样本库,给出了算法的实验结果并验证了算法的有效性。然后,在提取基频信息的基础上,论文详细地分析了基频信息的特点以及其总体分布情况,得出其总体分布满足亚高斯性的结论。这为声调识别模型的建立提供了很好的理论基础。在这种理论基础的支持下,建立了声调识别模型——GMM模型,并将模型在标准语音库863语料样本下进行了实验分析,给出了分析结果。接下来,基于GMM模型的声调识别结果,论文建立了汉语声调评估模型——基于GMM的后验概率评估模型,并给出了几种不同的打分方法。这种评估模型的建立,很好地融合了声调基频特征和声调识别结果。并就此应用了用于衡量汉语声调评估优劣的两个指标:相关系数和分级错误率进行评判。结合100位大学生语音语料和9位语言专家的打分情况,给出了对应指标下的结果。对结果分析得出如下结论:本文采用的基频提取算法、后处理算法、声调识别模型和声调评估模型在应用到汉语普通话声调评估系统中能取得较好的效果,为汉语普通话考核的推广和普及奠定了重要基础。最后,对本文的主要工作提出了不足之处,并对其进行了总结和展望。
其他文献
基于通达性系数来衡量各区县的通达性,再与GIS空间分析技术相结合,对2013年重庆市公路交通网络通达性进行研究,利用重庆市公路网的相关数据并以38个区县公路网络为研究对象进
<正>关于绘本阅读,我们对本园大班114位家长进行了问卷调查。结果显示,86%的家庭都给孩子准备了绘本,然而却有将近98%的家长不知道如何与孩子开展绘本阅读。家长们做的最多的
《杂文》篇居《文心雕龙》“论文叙笔”(文类论)第十四篇,多体一篇,具有一定的特殊性。在《文心雕龙》的研究中,与《杂文》篇相关的疑点主要有两个:一是《杂文》篇的类属问题
根据涟源钢铁公司电工钢生产工艺的需要,本文分四个部分研究了无取向电工钢变形行为及退火处理对组织与性能的影响。第一部分采用了Gleeble-1500热力模拟机对无取向电工钢进
本研究旨在探讨原发性胆汁性肝硬化中T细胞microRNA(miRNA)表达谱及其调控机制。首先采用芯片和定量PCR技术分析并验证原发性胆汁性肝硬化中T细胞miRNA的表达谱;然后培养自身
在我们生活中,语言是一门艺术,语言文学更是对艺术更高层次的体现。在语言文学中应用必要的修辞手法能够增强文学作品的艺术表达效果。每种修辞手法都有其应用的语境和方式,
<正>2015年8月29日,全国人大常委会审议通过了地方组织法修正案,明确了乡镇人大主席团在闭会期间的职责,在法律上推进了乡镇人大主席团在闭会期间的常态化、规范化,是乡镇人
随着计算机网络技术和软件开发技术的不断发展,远程教育作为一种新的教育模式在世界范围全面展开。而基于Internet的学习支撑平台的研究和开发是远程教育成功的重要因素。学
内部控制问题正逐渐为全球所关注。2004年美国COSO委员会风险管理框架(ERM)的发布,使内部控制理论进入了风险管理的新阶段。我国内部控制的理论研究与实践探索近年有了较快发