蒙古语语音识别系统的研究与优化

来源 :内蒙古大学 | 被引量 : 18次 | 上传用户:a610735932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是模式识别领域的一个重要的研究课题,它的发展将会对未来的人机交互界面带来极大的影响。语音识别是一门涉及面很广的交叉学科,它与语音学、语言学、人工智能、数字信号处理和模式识别等学科有非常密切的关系。蒙古语是黏着性语言,它是内蒙古自治区的主体民族语言。蒙古语语音识别的研究尚处于初级阶段,识别率低、鲁棒性差一直是蒙古语语音识别技术要突破的难题。本文结合蒙古语的自身特点,对蒙古文连续语音识别系统的声学模型和语言模型做了进一步的改进和优化。本文对蒙古语语音识别系统建立了上下文相关模型,然后分别用自底向上的合并法和自顶向下的决策树分裂法进行了参数捆绑,比较了识别效果。其次,建立了蒙古语语音识别系统的CHMM混合高斯模型和多数据流SCHMM模型,比较了模型性能。最后,建立了三元文法语言模型,并且对常用的几种语言模型的平滑算法进行了实验比较。在此基础上,我们通过隐马尔可夫模型工具HTK和CMU_Cam_Toolkit工具,采用上下文相关模型和决策树策略、多数据流SCHM、三元文法语言模型,对测试集做了大量的实验,句子的识别率达到了74.78%,词的识别率达到了96.96%,系统性能得到了优化,系统识别正确率也得到了明显的提高。
其他文献
遗传算法在计算智能、人工生命、图像处理和模式识别等方面具有重要作用。基本遗传算法在理论与应用技术上还存在着许多不足和缺陷,其主要表现为易陷入局部最优解和收敛速度
麝香是一种稀有的药材,是国家的重要战略资源,但产量严重落后于需求。我国上世纪50年代即开展的人工养殖,至今收效不明显,主要原因是,林麝育种成活率低、生产管理技术落后。
现代教育技术是随着现代科学技术发展而产生的一种新型教育技术,多媒体网络教学系统是现代教育技术的重要表现形式。然而,目前的多媒体网络教学系统的多采用C/S或B/S模式,即
作为人工智能一个新的分支,蚁群算法以其较强的鲁棒性、优良的分布式计算能力、易于与其他方法相结合的优点受到了越来越广泛的关注;应用涉及到从一维静态问题到多维动态问题
时间是现实世界的固有属性,许多数据库都存在时态语义问题,增加了时间因素的关联规则研究是非常有意义的。增加了时间因素也使数据库变得复杂。本章对时态事件空间给出定义,
双目立体视觉是用两个摄像机对同一景物从不同视角拍摄图片并根据成像几何关系获取三维场景。把基于双目立体视觉的三维重建和跟踪技术应用到计算机辅助外科手术的立体导航定
随着计算机处理器核数的不断增加,静态随机访问存储器因功耗和技术限制,已经无法满足系统越来越大的缓存需求。虽然动态随机访问存储器的容量足够大,但是由于它的高延迟特点,一直
当今,随着国内电信业的改革,各运营商在企业大客户、长途业务、IP业务、移动业务等领域展开了激烈的竞争。传统的以技术为驱动、以销售产品为目的的市场战略逐渐被以客户为中
面向服务架构(SOA)是一种用于构建复杂企业级应用系统和分布式系统的先进的软件架构,具有松耦合、平台无关等良好特性。SOA软件架构为构建具有灵活性、良好的互操作性的企业
无线传感器网络综合了传感器技术、嵌入式计算技术、无线通信技术,有着广泛的应用前景,被认为是21世纪最重要的技术之一。而由于传感器节点自身的能量,存储和处理能力的局限