大词汇量汉语连续语音的快速识别算法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:lishuangjie2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文介绍了HMM的基本原理和基于HMM的语音识别方法,描述了汉语的语音学基础和识别框架,并从搜索算法的角度对连续语音识别方法进行了讨论.Viterbi搜索算法是目前比较常用的一种连续语音识别算法.在这种方法的基础上,该文详细讨论了一些在尽可能不损失精度的同时有效提高识别速度的算法和策略:词法树搜索算法利用不同识别单元发音上的相似性,对搜索空间进行压缩;多遍搜索策略将识别分成若干个阶段进行,为应用复杂模型的识别系统提供了一个可行的实时实现的方案;剪枝算法在识别过程中的每个时刻,对搜索空间进行必要的限制,使搜索在一定范围内进行.为了说明上面的这些技术应用于汉语时的性能,在该文中结合基于字的汉语语音识别框架对联些技术进行了测试和比较.并且在传统的对状态空间的Beam剪枝策略的基础上,提出了一种包含终结状态剪枝和节点剪枝的新的剪枝策略.在论文的最后,介绍了两种目前正在研究中的压缩搜索空间的技术,分析了它们存在的问题,提出了未来的研究方向.
其他文献
当今社会,信息技术高速发展,人们正逐步进入一个崭新的信息时代,计算机和网络逐渐成为人们学习、生活和娱乐必不可少的工具。 同步多媒体合成语言SMIL是万维网联盟(W3C)推荐的
该文根据西南交通大学CAD工程中心提出的"协同设计系统整体框架",分析了协同设计系统与通信服务模块的关系,提出了协同设计系统中的通信模块的体系结构.详细研究了IP多播传输
本文首先简要介绍了可扩展标记语言(Extensible Markup Language,简称XML),说明创建科技论文XML文档的意义与使用价值,并提出一个利用科技论文解析转换器将网上科技论文从HTML格式
该文主要为了描述电力系统,首先提出了一种非自主T时延Petri网来描述电力系统常用的延时开关.其次提出受控变速的连续Petri网(CVCPN)来描述电力系统常变频控制,负反馈控制等.
审计跟踪是系统活动的记录,这些记录足以重构、评估、审查环境和活动的次序,它是记录用户注册时间、从何处注册、要做什么的文件,这些文件也记录管理员为以后分析保存的任何其它
作者开发了计算机到计算机结的IP电话软件,比较深入地探讨了IP电话中的一些关键技术.在该文第一章简要叙述了课题背景和开发过程.第二章较为详尽地讨论了IP电话的发展、实现
该系统主要由压缩编码模块、纠错编码模块和舆流分析校验模块组成.论文主要研究内容包括MPEG-2视频压缩编码的设计,舆流在信道传输时的纠错编码方案—RS(204,188)编码器和卷
该文的主要想法是想将形式化语义方法引入工业界应用极为广泛的VerilogHDL中,为Verilog的形式化验证以及自动求精提供严格的语义基础,其主要内容包括三方面:1.该文首次给出了
随着Internet的发展,计算机软件系统的信息处理规模也呈持续增长的趋势。然而,由于传统分布计算技术的固有缺陷,软件系统却变得更庞大、缓慢和脆弱。在这种情况下,分布对象计算应
微阵列技术是实验分子生物学最新的重大突破之一,作为一个强有力的工具,它可以同时得到上千个基因的表达水平,产生大规模基因表达数据。由于在基因表达分析中有巨大的潜力,有