基于HMM的维吾尔语连续语音识别研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:ag128333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术的发展已经有50多年的历史,并达到了相当高的水平。在国内,汉语语音识别也得到了充分了研究,已走出实验室达到实用化的阶段。但少数民族语言的语音识别还处于起步阶段,近年来,少数民语音语言文字研究正逐步成为新的热点。新疆是民族地区,少数民族语言文字有着广泛的应用,也是新疆信息产业中的一大特色,研究少数民族语言、语音、文字处理具有重要意义。   本文为维吾尔语连续语音识别研究。以提高语音识别率为目标,构建了基于HMM的维吾尔语连续语音识别实验平台,对语音特征提取、声学模型、发音模型及语言模型等方面进行深入探讨。首先,针对特征提取,系统采用梅尔倒谱系数(MFCC),为了消除信道对语音信号的干扰,使用倒谱均值相减法对特征进行补偿,利用异方差线性鉴别分析对MFCC声学特征进行变换和降维,选取更具区分性的特征,以提高语音识别的性能,并对不同的MFCC特征对识别率贡献率作了比较。针对声学模型,我们探讨单音素,词内三音素以及状态共享技术、高斯混合模型的使用,并对维吾尔语的建模单元、音素子类别集进行了精心的设计和优化。最后,对于语言模型,利用Kneser-Ney算法进行平滑,抽取题材相近的文本语料进行语言模型的训练,以达到较高的识别率。本文采用基于电话信道的维吾尔语自然发音语音语料作为实验数据,在HTK3.4平台下进行实现和研究,并有一些初步的结论和发现。
其他文献
无线射频识别(RFID)技术是目前国际研究的热点之一,它可以应用在以供应链管理为代表的国民经济的各个领域。由于技术和市场等诸多因素,至今还没有走向大规模的开环应用。在RFID应
学位
天网FTP资源搜索引擎是对中国部分IP集合进行扫描,获取其中匿名FTP站点文件信息来为广大互联网用户提供资源搜索服务的垂直搜索引擎。随着中国IP集合以及引擎扫描集合变大,旧
无线射频识别(RFID)技术的应用越来越广泛,目前已成为国内外研究的热点。但目前绝大多数RFID应用仅限于企业内部的闭环应用,尚未走向跨地区、跨行业乃至全社会的规模化应用。其关
学位
随着经济的发展,我国的社会化进程加快,各方面都取得了快速的发展和提高,这就产生了一个需求,即如何更好的适应和指导这些发展变化。而这些都离不开对宏观经济走势的把握,无论是对
学位
禽流感的每次爆发都会对全球的经济产生巨大的冲击,而野生鸟类是禽流感感染的主要群体,是疫情传播的主要源头之一。当前对禽流感的预防和控制一直是一个巨大的科学难题,目前采用
随着集成电路制造工艺的进步和处理器设计技术的发展,单发射处理器凭借其在低成本、低功耗和高可扩展能力方面的优势,获得了日益广泛的应用,表现出了强劲的生命力。为进一步满足
学位
随着互联网上提供相同功能Web服务的数量日益增加,如何找到适合服务请求者需求的Web服务已成为服务计算领域研究的热点。目前普遍关注的基于QoS的Web服务发现的研究工作中还
访问控制是网络安全标准化的ISO国际标准组织在信息系统的安全基础设施的定义(ISO7498-2)必须包括5个安全服务,信息安全和保护一对主要的技术和有效的手段。传统的访问控制是
学位
Maze是目前中国教育网内最大的P2P文件共享系统,系统中有着大量的用户共享文件,Maze中部署着一个提供共享文件查询服务的索引和检索系统。现有的Maze索引和检索系统认为所有
信息和网络技术的发展,给人们传播和获取信息带来快捷和方便的同时,也对信息安全方面带来了挑战。如何保证信息在网络中的安全传输是人们非常关切的问题。传统的加密技术通常