藏语连续语音识别的语言模型研究

被引量 : 0次 | 上传用户:pk8984812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术就是让机器通过识别把语音信号转变成相应的文本的技术。它主要包括特征提取、模式匹配和模型训练三个方面。现阶段汉语和英语等应用比较广的语言的语音识别技术己经相当成熟,但是藏语等少数民族语言的语音识别应用还很少。本文的目的就是研究语言模型在藏语连续语言识别系统中的应用。语音识别主要包括声学和语言模型,相对于比较成熟的声学模型研究来讲,语言模型有着更广阔的发展前景。实验表明,语言模型的研究改进对于语音识别系统的识别率有着很大的提升。该论文结合藏语拉萨话的特点,提出了新的文本预料的筛选方案。利用HTK工具对语料进行处理,生成词典,生成语言模型。由于稀疏数据的问题,统计语言模型的平滑算法直接影响到语音识别系统的性能。本文详细的分析比较了加法平滑算法、回退平滑算法、线性插值平滑算法和非线性折扣平滑算法。经过比较各种算法的困惑度和语音识别系统的识别率,最终选定修正版的Kneser-Ney平滑算法应用到基于HTK的藏语连续语音识别系统中。研究中用到的语料是西北民族大学中国民族信息技术研究院录制的30万句藏语拉萨话新闻语料,通过训练生成三元统计语言模型。实验结果表明,在各种平滑算法中,修正版的Kneser-Ney平滑算法的困惑度最小,应用此平滑算法的藏语连续语音识别系统的句子识别率从原来的67.83%提高到78.98%,词的识别率由原来的91.34%提高到94.78%。
其他文献
商标翻译并不是简单机械的语言文字的切换,也不是纯粹的经济活动,而是一种带有明确商业目的的跨文化传播与交流活动。商标翻译需要充分考虑禁忌语、消费心理、价值观等跨文化
科学和工程技术中的许多实际问题都可以转化为微分方程的求解问题,而大部分的微分方程很难求出其解析解,因此,微分方程的数值解法的研究就具有重要的意义。由于样条函数具有
<正>美国著名广告大师李奥贝纳曾说过:"谁能从产品层面真正占领消费者的心,谁就能真正成为市场的赢家!"作为日常生活不可或缺的一部分,彩妆扮演着不可或缺的角色。但在日常生
功能性腹痛综合征(functional abdominal pain syndrome,FAPS)是一种少见的功能性胃肠病(functional gastrointestinal disorders,FGIDs),患者腹痛程度重,部位多不固定,与进食、
论述了东芝600MW汽轮机低压A、B内缸特大张口产生的原因、消缺经过及具体工艺。
<正> 笔者曾遇到1例支气管哮喘患者因服大黄苏打片4片后,出现皮肤痒疹红斑,哮喘加重的过敏反应,并经皮肤斑贴试验证实。兹报道如下,以引起临床注意。病历摘要: 陈×,女,31岁,
结合当前林下经济发展的现状,本文结合当前林下经济发展的情况,提出因地制宜,科学规划,规范运行,加大扶持,创新模式及提升效率。
脑梗塞所致的偏侧舞动症和舞蹈症(HB-HC)足发生在脑血管急性期的一组症状,其发生率约占急性脑血管病的1%。现将我院1993~2004年收治的25例分析如下。
增加燃气轮机进气冷却装置,计算冷却产生的冷凝水量,并讨论进气冷却的相关影响因素,为确定合理的水资源方案提供参考。
<正>1922年冬,杭州第一条公交线路开通,历经90年的发展,杭州公交已拥有9家分公司,12家全资子公司,12家控股公司,16家参股公司。开通了567条公交线路,有7582辆公交车在路上运