连续语音流中大词表关键词检测算法的研究

被引量 : 0次 | 上传用户:foxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与人之间最为自然的交流方式,也是最有效人机交互方法之一。语音识别关键词检测技术是近年来语音识别领域的一个研究热点。 本文分析了关键词语音识别技术的发展历史和国内外的发展现状,介绍了关键词检测技术广泛的应用领域。本文研究的重点为具有说话人无关、针对连续语音流、大关键词表、任务无关等特点的关键词检测系统。 针对这一目标,本文提出了采用音节格识别+动态规划关键词搜索+置信度关键词确认的系统框架,设计了一个性别判决器,采用了性别相关语音识别模型,提高系统的性能。 本文在贝叶斯信息准则基础上提出了面向混合概率密度模型的改进贝叶斯信息准则(IBIC)来选择每个状态的高斯混合分量数。该方法可以更细致的优化语音识别声学模型的复杂度,提高模型区分能力。 在分析PC机硬件工作原理的基础上,本文提出了多帧缓冲同步搜索算法和马氏距离并行内积化的算法,并结合了并行指令集的应用。在对于识别率无损的情况下,将识别速度提高了3倍以上。 本文引入了基于帧归一化的后验概率密度模型作为置信度,分析了各种情况对置信度的影响,提出了采用等虚警归一化的方法对各个音节的帧平均后验概率进行补偿的方法;并提出了基于音节置信度的关键词动态规划检测算法。本文分析了语速的定义与语速对于识别性能的影响,提出了人工语速统计匹配计算方法,并采用基于语速估计的语速补偿算法,取得了较好的结果。 最终实验表明针对一个100个关键词的检测任务,系统的品质因数为92.9%。在虚警率为5FA/HR/KW的情况下,检测率为95.9%。
其他文献
针对常用的硅基MEMS器件难以在高温、高压、腐蚀性等条件下正常工作的情况,本文开发了适用于恶劣环境的碳化硅MEMS谐振器。 本文利用PECVD手段制备碳化硅薄膜,其低温特性使
激光玻璃在激光技术应用领域中具有广泛应用,使激光得到了快速的发展,特别是在大功率激光器的研究中,激光玻璃起着极其重要的作用。随着光子晶体光纤的诞生,人们开始设想利用
为适应自然环境中不断变化的光照条件,光合生物可以通过状态转换来调节激发能在PSⅠ和PSⅡ之间的平衡。状态转换是植物短时适应的一种重要调控机制,主要是通过PSⅡ主要捕光色素
随着抗生素的大量应用,病原微生物对抗生素抗性的日益提高,寻找具有新型作用机制的抗生素己迫在眉睫。据统计,目前从陆地微生物筛选到的活性物质中,有90%都是已知的,这给新型活性物
水稻(Oriza sativa L.)是世界上最重要的粮食作物之一。稻瘟病(Magnaporthe grisea)是分布广、危害大的水稻主要病害。本研究采用砂培实验,以抗病性不同的一对水稻近等基因系
从2003年12月至2005年1月,作者在黑白仰鼻猴(Rhinopithecus bieti)分布区的南端(26.23°N,99.25°E,海拔2700-3600 m)运用直接观察法与食物遗迹法收集了龙马山群(大约80只)的生
嫦娥工程是我国继人造地球卫星和载人航天之后,向深空领域发展的具有里程碑意义的航天工程。“嫦娥一号”绕月探测卫星将于2007年发射升空,“二期”的各项任务正处于紧张有序的
学位
学位
光通信系统正向多年来所追求的全光网方向发展。全光网需要众多可调谐器件的支撑,这类智能光电子器件已成为各国抢占光通信技术的战略制高点。可调谐光滤波器是全光网所需的关
学位