汉语语音关键词识别算法的研究与实现

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:hjjcumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联的快速发展带来最大的好处是信息交流的便捷,而随着信息交流的便捷产生了信息沟通方式的改变,信息交流从最初的文字图形等逐渐向语音视频等多媒体的形式多元化发展,因此,语音视频等多媒体中的音频关键信息识别技术显得尤为重要。本文在对汉语语音关键词识别技术的发展现状、主要技术和所面临的关键问题研究的基础上,针对有监督和无监督的两种识别算法分别进行了实现和性能对比分析,并提出了一种改进算法,保证识别率不变的同时有效的提高了识别效率。本文研究依托于相关科技研究项目中的社交系统模块,重点在于对汉语语音关键词识别算法的研究与实现,以及算法各环节所涉及到技术的对比分析及应用,主要研究工作包括:(1)对基于补白模型的有监督关键词识别算法进行了研究与实现,采用了半监督的模型训练方法,充分利用了未经标注的原始语音提高声学模型性能,对比分析了补白模型数量对于算法性能的影响,并通过训练具有抗噪性能的声学模型和CMS相结合的方法有效的改善了算法的抗噪性能。(2)针对有监督的识别算法不能解决少资源语言识别问题的缺点,对基于SLN-DTW的无监督关键词识别算法进行了研究与实现,对比了基础模板数量对于算法识别性能的影响,改进了模板融合方法,相比于传统得分融合的方式,降低了识别过程的时间开销,并对比分析了有监督和无监督算法的基础数据依赖性。(3)针对有监督和无监督识别算法均存在时间复杂度随语音长度线性增长的缺点,在无监督识别算法的基础上,从效率提升的角度,提出了一种基于语段特征和Syllable based-DTW的快速关键词识别算法,由更低维度的短时谱特征均值化后表示每个音素段构成语段特征,结合改进的Syllable based-DTW匹配方法实现关键词候选区域的快速提取,对关键词候选区域根据匹配得分建立优先队列后实现关键词识别。并采用多进程并发结合共享内存的结构实现了关键词识别系统自动化处理。通过多组实验对比证明了本文提出的改进算法能够在保证关键词识别性能的同时有效的减少识别时间,提高识别效率。
其他文献
目的:探讨H型高血压患者颈动脉内膜厚度与亚甲基四氢叶酸还原酶(methylentyahydrofotate reductasa,MTHFR)基因多态性的关系,为临床早期诊断和早期采取干预措施以降低心脑血管疾病的发生和改善患者的预后提供理论依据。方法:选择2016年8月-2018年12月在合肥市第二人民医院接受治疗的274例高血压患者作为高血压组研究对象,另选择同期在我院接受体检的180位健康体检者
工程项目是指造福国家和人民,建设社会主义新社会,满足当今人民日益增长的需求,满足经济发展需要和满足科学进步需要的国家工程建设项目。例如,公路运输项目,水利项目,铁路运输项目,钢铁企业项目,文化建设项目,“菜篮子”项目,农田灌溉项目等都是工程项目。这些项目使人们的社会生活各个方面都得到极大的方便,在国家经济发展中起到了重要作用,也为社会发展取得了不错的经济、政治和军事利益。但是,近年来,随着我国经济
根据莱斯、纽马克等著名语言学家的研究成果,文本类型可分为三种:信息型文本、感染型文本和表达型文本,深入了解分析文本类型有助于对文本功能进行分析,同时也有助于分析应用
目的本研究运用外科手术法建立兔胫骨平台骨折内固定术后模型,采用单纯针刀、单纯CPM以及针刀联合CPM干预,并建立模型组与空白组进行对照,观察家兔体重、患膝关节活动度、患膝关节直径(肿胀程度)、患膝关节关节液内炎性因子、膝周韧带组织形态学、纤维化程度以及韧带组织中MMP-13、TIMP-1含量的变化,验证单纯针刀、单纯CPM以及针刀联合CPM干预治疗兔胫骨平台骨折内固定术后关节粘连的有效性,探讨其中
2019年1月,中国证监会发布《关于在上海证券交易所设立科创板并试点注册制的实施意见》;2019年7月,科创板正式开市;2020年3月,新《证券法》正式实施,明确了注册制改革方向。科创板开设与注册制改革推进,是深入落实国家创新驱动战略,完善资本市场制度基础,推动经济高质量发展的重要举措。科创板试点注册制过程中,中国证券监督管理委员会(简称证监会)负责科创板股票发行注册,交易所负责科创板发行上市审核