模糊理论与神经网络在语音识别中的应用

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:qingqiu12157
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类之间交流的最重要的工具,因此人们一直希望能不用键盘,不用手写,来操作计算机、手机、学习机、车载导航、以及智能玩具等各类信息终端产品,使它们都具备“能听会说”语音识别的功能,只用说话就可以进行网络搜索、发短信、发微博、玩游戏以及机械操作。因此,对语音识别技术的研究具有重要的理论价值和实际意义。   本论文首先介绍了语音识别的基本知识,即语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。在此基础上本论文所做的主要工作是:   第一,详细分析了现阶段的各种端点检测算法,发现在信噪比较高时检测性能都较好,但在低信噪比下,这些算法存在了性能明显下降和运算时间过长的问题,对后续的识别产生了直接不利的影响。因此,在前人研究的基础上,本论文提出了一种新的端点检测算法基于模糊理论的端点检测算法,主要是针对在低信噪比的高斯白噪声背景噪声环境下的双字语音识别。   首先提取语音信号的时域特征值短时能量和短时平均过零率,从而计算出短时能量变化率和短时平均过零率变化率,然后通过模糊统计实验法构造其隶属函数,最后通过比较隶属度的大小来判定语音端点所存在的区域。   针对所提出的端点检测算法,本论文通过仿真实验对其性能做了比较和分析。验证了此方法的可行性和适用性。   第二,通过对目前语音识别技术的分析,讨论所存在的问题,从而确定了本论文的研究方向。提出利用LVQ神经网络进行语音识别,并分析讨论了在语音识别研究中LVQ神经网络的设计原则,以及在识别中LVQ神经网络所存在的对初始权值敏感的问题,从而对LVO神经网络做了进一步的改进,在网络的初始权值的设置上采用遗传算法,达到了解决对初值敏感的问题,研究构造了相应的语音识别模型与算法,并完成了实验软件平台的设计与开发。   通过仿真计算,比较了相应算法的识别性能及应用特点,分析结果表明,将LVQ神经网络应用于语音识别领域,取得了较好的识别效果。同时也表明了神经网络在语音识别中的优势。
其他文献
以多媒体、网络技术为代表的现代信息技术促进了教学的快速发展,使教学环境、学习方式发生了巨大变化。与此同时,人们对于支撑网络教学的应用程序的需求持续增长,要求也越来越高
伴随着教育信息化的发展,Web技术与e-Learning使人类学习环境发生了根本性的变革。为构建跨组织、跨系统平台的海量知识融聚共享环境,人们提出了学习对象(LearningObject)的
随着博客影响力的不断增加,博客被更多领域的人作为交互和表达思想的工具,并以站点的形式在万维网上形成了博客空间。面对博客空间的急剧膨胀,博客搜索也变得必要迫切。尽管
数据仓库是数据存储和数据管理技术,是实现基于特定分析主题的数据存储、数据汇总、数据分析和应用的复杂系统。数据仓库中存储了海量的数据,如果这些数据遭到非法访问或破坏
随着软件产业的发展,越来越多的行业领域需要专业软件的支持,软件需求也越来越领域化、专业化,随之而来的是客户需求的快速变化和软件复杂度日渐增高。然而传统的软件开发方
作为电子商务的重要组成部分,基于Internet的电子交易受到了广泛的关注。SET交易过程十分复杂,在完成一次SET协议交易过程中,需验证电子证书9次,验证数字签名6次,传递证书7次
在储存海量数据的数据仓库中,由于其潜在的数据价值随着数据挖掘技术的发展与应用而被各研究领域所关注,包括商业、军事及科研等,涉及范围广泛,随着数据仓库安全性问题也得到
面向特定主题的信息采集是垂直搜索引擎的关键技术之一,直接影响到搜索结果的速度和相关性。研究面向特定主题的信息采集,应用分步骤判断方法计算页面相似度,改进PageRank链
随着移动通讯技术的迅速发展,移动电话等便携设备成了语音识别的重要应用领域。对于便携设备来说,运算量和网络带宽始终是制约语音识别应用的瓶颈。分布式语音识别的特点是:
近年来,随着国民经济信息化的不断发展以及Internet的普及,中文信息处理技术的应用日益广泛,如搜索引擎、自动翻译、语音识别、信息检索、自动分类、自动文摘、文本的自动校