基于多分类器的少数民族语种识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:pdahome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是多民族统一的国家,随着科技和社会的进步,通信技术在少数民族地区已得到普及应用,民族语对话系统、多民族语信息查询系统、多民族语语音识别系统和民族语口语翻译系统的应用需求也成快速增长之势,而少数民族语言的语种识别是这些系统的组成部分。因此,这是一项复杂、有挑战性、有意义的研究工作,值得我们去深入研究。本文基于实验室设计制作的电话语音少数民族语种识别数据库,探索提高少数民族语种识别正确率的方法,着重解决少数民族语种识别中所遇到的汉语借词影响识别率的问题。论文的主要工作包括:1、搭建基于GMM-UBM模型的语种识别系统框架,以此作为基线系统。在特征提取模块,采用了RASTA滤波,VAD和倒谱域减均值等技术以提高特征参数对噪声和信道的鲁棒性,在此基础上,提取SDC声学特征参数。在训练模块,采用基于MLE准则的训练方法先训练出通用背景模型(UBM),再以此为基础,自适应出各个语种的声学模型。在测试模块,首先对得分进行归一化,以似然值最大作为判决规则。2、为了进一步提高少数民族语种识别系统的性能,把基于MMI准则的区分性训练应用到基线系统框架中。传统的MLE准则着重于调整模型参数,而MMI准则更着重于调整模型之间的分类面,可以更好的对训练数据进行分类。测试结果表明,改进后的GMM-MMI系统对不同时长测试语音的识别正确率均高于基线系统。3、考虑到民族自然语流中汉语借词的发音因受民族语发音的影响而带有其民族语口音的特点,根据分类器融合的原理,在特征层提取超音段信息(基音频率F。)对SDC特征进行互补,以更好地刻画含有汉语借词的民族语语音特征。以基音频率F0作为支持向量机(SVM)的输入,进行语种模型的训练。在决策层,测试语音首先通过GMM-MMI分类器和SVM分类器分别进行分类,然后将两个分类器的识别结果进行线性融合。实验结果表明,两种系统融合后的识别率比单独的使用GMM-MMI分类器和SVM分类器分别上升了18.00%和2.48%,而3s(含汉语借词)语句的识别率则分别上升了25.83%和3.7%,且汉语借词的影响也几乎可以忽略不计。这说明,融合后的MMI.SVM系统有效降低了汉语借词对少数民族语种识别的影响。
其他文献
分类是机器学习中一个非常重要的方法,在已有数据的基础上构造出一个分类模型,用来判定新的测试数据的类别。同时稀疏化模型的研究成为研究的热点,希望算法可以得到很好的分
电子技术的广泛应用使得汽车电控系统的结构越来越复杂,当发生故障时,判断故障发生原因以及发现故障的部位也相应的变得越来越困难。随着电子技术和故障诊断技术的发展,汽车
磁力仪是通过测量磁感应强度大小和方向来进行磁异常数据采集仪器的统称。磁场测量技术是一种研究与磁现象相关的物理现象的重要手段。利用磁力仪进行磁异常数据采集是一种非
随着世界范围内对社会公共安全和公众保护需求的日益增长,数以万计的监控摄像头被安装在公园、体育场馆、大型广场、学校、医院、商业街、住宅小区等公众活动和聚集的场所,有
在近年来,语音识别系统已经广泛应用到日常的工作生活中,例如语音拨号系统。同时,现在的语音识别系统仍然是依靠模式识别技术来实现语音信号的分类判别,模式识别技术关键部分
油田修井机是采油生产过程中不可缺少的维护工具,其可靠性和动态性能直接影响修井作业的效率及成功率。传统修井机以柴油发动机为动力,传动效率低、污染严重;而使用常规变频
移动式机器人是一类重要的科学研究和实验研究机器人。基于视觉的移动式机器人的遥操作问题,既是机器人控制研究的重要问题,也是机器视觉研究的重要问题。基于视觉的移动式机器
作为一种研究复杂系统中大量元素间相互作用的有效工具,复杂网络在最近几十年间取得了许多重要进展。不同于一般的网络,空间网络中的每个网络节点都有自己固有的空间地理位置,空
超临界流体萃取装置是一种工艺流程复杂,技术控制要求严格的设备,它对生产过程中的每一个阶段、每一个过程都要求精确控制,如果某一个过程出现差错,最终可能无法得到符合品质
近年来,DC-DC变换器作为开关电源的核心,以其效率高、重量轻、体积小等固有优点,基本代替了传统的线性电源,并加之巨大的市场潜力,其已经成为国内外学者、科研人员研究的热点