基于统计模式识别发音错误自动检测的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：kcsj001

【摘要】

：

发音错误自动检测是计算机辅助语言学习系统的关键技术,在很大程度上决定了计算机辅助语言学习系统的性能。可靠的自动发音错误检测技术有助于计算机辅助语言学习系统了解学

【作者】

：

张峰

【出处】

：

中国科学技术大学

【发表日期】

：

2009年期

【关键词】

：

发音错误检测统计语音识别比例化对数后验概率选择性最大似然线性回归区分性训练后端处理机器学习半监督聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

发音错误自动检测是计算机辅助语言学习系统的关键技术,在很大程度上决定了计算机辅助语言学习系统的性能。可靠的自动发音错误检测技术有助于计算机辅助语言学习系统了解学习者掌握语言的水平,分析出学习者的发音缺陷,针对性的给出改进意见,并给出对应的学习材料,有效的提高学习者的语言水平。本文针对主流的基于统计模式识别的发音错误自动检测技术进行了深入的分析,在声学模型和后端处理方面都进行了有针对性地研究,建立了性能稳定的发音检错系统。本论文的具体工作和研究成果概述如下。首先,本文调研了发音错误自动检测技术,通过对该研究背景和现状的分析,选择了基于统计语音识别的策略作为发音错误检测的基本方法。在对基本的发音检错的系统进行介绍时,本文重点说明了系统中的错误检测度量得分算法。针对原有的错误检测度量得分算法在实际使用中的缺陷,本文提出了SLPP算法,其检错性能要明显好于原有算法。在对本文的实验数据库进行介绍时,分析了数据库上几个专家检错结果的一致性问题,了解了人工发音检错的性能,说明了发音检错自动任务的挑战性。其次,在声学模型的改进方面,本文提出了引入统计语音识别中的自适应技术,将该技术用于测试数据,减少测试数据与训练数据的不匹配,同时也应用于训练数据,以有效的估计出话者无关的规范模型。在对测试数据采用自适应技术时,本文引入了语音识别中成熟的MLLR算法。由于语音检错与语音识别的目标不一致,MLLR算法不一定能提高发音检错系统的性能。为此,本文针对发音检错的目标,提出了SMLLR的自适应技术;在对训练数据采用自适应技术时,本文引入了语音识别中的SAT算法,以生成规范的声学模型,提高检错性能。由于规范模型会导致其与测试数据更加不一致,因此需要把SAT技术和SMLLR技术结合使用,以有效的提高发音检错系统的性能。再次,在声学建模的改进方面,本文还提出了采用语音识别中的区分性训练的思想,针对性的设置与发音检错目标相一致的声学建模目标函数。通过回顾语音识别中的各种区分性训练的方法,本文说明了这些区分性训练的方法如何与语音识别的提高识别率的这个目标函数相一致。然后针对发音检错的任务,本文分析了该任务的目标函数以及与之对应的区分性训练的策略,提出了发音检错的区分性训练的方法要与错误检测度量得分算法相一致,并且提出在进行区分性训练时,训练数据库中除了正确发音的样本外,还需要错误发音的样本,否则区分性训练可能作用不明显。此外,除了声学建模的改进以外,本文还从发音检错的后端处理方面,提出了三维后端归一化的处理策略和基于机器学习的后端处理策略。首先,通过对专家打分和实验数据的分析,提出了要在说话人层次上引入说话人整体发音水平的特征;其次,通过对文本相关的后验概率的分析,提出了要在说话内容层次上引入音素类别的特征;再次,通过对系统使用中的干扰问题的分析,提出了要在说话时间层次引入前后文得分的特征。最后,通过引入这三个层次的特征,提出了三维后端归一化的处理策略,大幅度提高了系统性能。三维后端归一化的处理策略也有一些问题,比如多维特征的处理。为了解决这些问题,我们提出了更加可靠的基于机器学习的后端处理策略,通过SVM来处理多维特征的优化。最后,通过以上的研究工作,可以实现一个性能比较稳定的发音检错系统,在此基础上,本文提出了发音检错的声学模型自动更新策略,该策略能通过对未标注的原始数据的获得,针对错误发音样本进行处理,不断的提高发音检错系统的性能。首先,本文分析了错误检测度量生成算法,说明了对错误发音进行建模的必要性;接着通过对错误发音的特点和非监督的参数估计的分析,提出了几种错误发音建模的策略,其中错误发音半监督聚类建模的算法效果最好。进一步,通过已建立的性能比较可靠的检错系统以及错误发音建模算法,本文提出了发音检错的声学模型自动更新策略,能够处理未标注的原始数据,改进声学模型的建模空间,提高发音检错系统的性能。

其他文献

密度对浙贝母产量和收益的影响

进行不同种植密度对浙贝母的产量、增值率、收益的影响的试验,结果表明,随着种植密度的增加浙贝母产量呈现递增趋势,并且达到极显著的水平,行距10cm、株距10cm的处理667m^2产

期刊

浙贝母密度产量衢州

重磁三维物性实时可视化反演关键技术研究

长期以来,“重磁三维反演计算”和“反演结果可视化评价”是以两个前后独立工作的方式而存在。三维反演计算通常很耗时,反演结果无法及时得到评价,同时,基于当前的结果评价,

学位

三维物性反演可视化反演实时三维可视化人机交互软件多线程

丹皮酚通过下调COX-2表达及PGE2合成降低大肠癌细胞侵袭能力

目的观察丹皮酚对结肠癌LoVo细胞侵袭能力的影响,并探讨其是否通过下调环氧合酶-2（COX-2）表达及PGE_2合成发挥抗肿瘤作用。方法分别用0、30、60、120 mg/L的丹皮酚体外处理LoVo

期刊

丹皮酚结肠癌LoVo细胞侵袭环氧合酶-2前列腺素E2

美国大学开发新型人造心脏:有望实现永久性修复

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

会议

无锡城市公园植物群落景观分析

在全面调查5个具有代表性的无锡城市公园的基础上,选取公园内37个典型植物群落景观作为研究对象,记录群落位置、群落植物物种、群落结构、群落郁闭度和群落基本观赏特征,进行

期刊

城市公园植物群落景观植物物种景观分析

基于图像特征的列车自主定位方法研究

综合检测列车是重要的基础设施检测装备,是高速铁路安全运营的保障。实时高精度的位置信息是综合检测列车准确检测的前提,研究一种高精度自主定位方法对高速综合检测列车国产

学位

列车定位视觉应答器(VsB)图像特征支撑矢量机(SVM)Hough变换定位模型

面向视觉监控的视频压缩研究

视觉监控通过分析来自一个或多个摄像机的信息，可以监视和控制大而复杂的空间上分布的区域。人们目前的研究主要集中在如何实现或代替人的视觉功能或实现尽可能的自动监控系统

学位

视觉监控视频压缩压缩域运动检测运动分割运动估计基于对象的编码ROI编码

滚揉工艺对产品损耗的影响

滚揉机是肉制品加工生产的关键设备,由于采用了滚揉工艺而使产品的口感、质量、出品率都有较大的改善与提高.自从19世纪70年代末和80年代初滚揉工艺引进后对我国的肉制品工艺

期刊

滚揉工艺肉制品

事业单位财务管理的有效措施研究

随着中国经济的飞速发展,科学技术的不断进步,如今我国的社会也出现了翻天覆地的变化。但是笔者发现我国的事业单位在财务管理上依然采用传统的方法,因此还存在一定的问题,这

期刊

事业单位财务管理存在的问题改善措施

基于统计模式识别发音错误自动检测的研究

其他学术论文