【摘 要】
:
目前,中小词表的孤立词识别系统的性能已经可以达到比较令人满意的效果。但是,随着词农的增大,语音识别系统的搜索空问迅速膨胀,导致孤立词识别系统的性能也急剧下滑。因此,基
论文部分内容阅读
目前,中小词表的孤立词识别系统的性能已经可以达到比较令人满意的效果。但是,随着词农的增大,语音识别系统的搜索空问迅速膨胀,导致孤立词识别系统的性能也急剧下滑。因此,基于海量词表的孤立词识别技术仍然有待于进一步的研究。本文将讨论在海蛳词表孤立词识别研究方而所遇到的问题和取得的成果。1、深入研究了基于两级识别的孤立词识别算法,并提出了基于前缀树的编辑距离计算方法。在而对批量的编辑距离计算任务时,基于前缀树的编辑趴离计算方法能够有效的加快编辑距离计算的速度,并且在词表规模增大的时候,该算法的时间消耗增长速度相较于普通的编辑趴离计算方法明显较慢,对词表规模具有相对较好的不敏感性。此外,还探讨了两级识别的孤立词识别算法中第一级识别基元的选择的问题。2、提出了基于候选拥有状态数(Number of States Possessed By Hypotheses)的剪枝算法。根据解码过程中候选所拥有状态数进行剪枝。在传统孤立词识别系统中能够在获得相同识别率的情况下获得36%的速度提升。在连续语音识别系统中,能够在识别字准确率下降0.14%的情况下获得35%的速度提升。3、针对闭集任务,提出了基于语言模型回退概率的剪枝算法。在第一级小基元识别的过程中抛弃那些需要根据语言模型回退概率来计算语言模型得分的候选,有效的加快了第一级小基元识别的速度。4、研究并搭建了基于WFST的识别网络。并将基于WFST的识别网络同传统的基于前缀树的识别网络进行了对比。实验结果表明,采用基于WFST的识别网络能够有效的加快识别速度。
其他文献
“空巢青年”作为近年来出现频率渐高的网络热词,已经引起相关领域研究者的重视.对于这“似曾相识”的研究对象,学界尚缺乏理论层面的整合性探究.基于社会建构论的视角,展开
摘要:近几年的高考卷中越来越多的句子因信息覆盖面广而变长且结构复杂,这些句子对文章部分或整体理解有影响,或直接涉及考题的关键信息。因此,想方设法突破阅读长难句就成了刻不容缓的事情。本文总结了长难句的特点,提出了破解长难句的策略,希望帮助学生消除对长难句的恐惧。 关键词:阅读;长难句;策略 中图分类号:G632.0 文献标识码:A 文章编号:1992-7711(2017)10-0059 近年来
摘要:“中高年级自主探究四环节阅读教学策略的构建”是近年来阅读教学不断改革的成果总结,旨在实现新课程理念下的教学方式和学习方式的转变,突出学生在学习过程中的主体地位,使阅读成为提升学生语文能力和语文素养的载体。策略的基本流程为预习探究——合作交流——品读体验——巩固延伸。实施策略的关键是教师如何引导学生主动参与学习,充分发挥学生的自主性、独立性、能动性和创造性。本文就对小学中高年级语文自主探究阅读
随着信息网络技术的飞速发展,3C系统(自动化、计算机化、通信化)在智能家居领域的应用也越来越广,它通过将各种家用电气化设备互联互通,完成一体化控制,并能实现远程管控和信
目的:探讨风湿性心脏病钙化心脏瓣膜中是否存在纳米细菌以及钙化心脏瓣膜中纳米细菌的分离、培养及鉴定。方法:实验分为6组:病变瓣膜组,正常瓣膜组,γ射线消毒血清阴性对照组,纳米
胰高血糖素样肽(glucagon like peptide-1,GLP-1)是肠道朗格汉斯细胞(Langerhans cell)分泌的一种具有多种生物学功能的活性肽。近年来它对糖尿病,特别是Ⅱ型糖尿病的治疗作
现代无线通信高数据量、大数据流和大带宽的无线通信服务,极大推动了全世界范围内对60GHz毫米波频段通信技术的研究,60GHz毫米波通信发展的主要推动力是该频段高富余的频段资
光纤通信技术是网络通信技术中的一种新兴技术,而波分复用(Wavelength Division Multiplexing, WDM)光网络具有实现简单和良好的扩展性,使其逐渐成为第二代广域骨干网的候选