Mel倒谱系数相关论文
声纹识别技术的关键是从语音信号中提取具有说话人特征的语音特征参数。考虑到当下大多是运用鉴定人的经验对两段语音是否来源于同......
本论文对语音识别的理论和关键技术进行了深入细致地研究。在深刻理解语音识别基本原理的基础上,实现了包括语音采集、预处理、......
语音转换的研究是目前语音信号处理中继说话人识别技术、语音合成技术之后的又一个新的研究领域,它的研究具有非常重要的理论价值和......
本文基于自动语音识别(ASR)的原理和过程,结合人工神经网络(ANN)的建模理论及特点,主要研究了隐含马尔可夫模型(HMM)与自组织神经网络(SO......
随着移动通讯技术的迅速发展,移动电话等便携设备成了语音识别的重要应用领域。对于运算能力有限的便携设备来说,运算量始终是制约......
该文基于语音产主的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论.HTK......
语言是人类所特有的也是最重要的交际手段,随着科技的发展,在现代社会,电话逐渐成为人们日常交流和感情沟通的重要手段,电话语音的识别......
语音是自然人之间最方便的交流方式,语音识别技术是人机交流的一个重点发展方向。语音识别技术作为最便捷的人机器互动方式,随着计算......
语音识别是一门内涵丰富、应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。语音识别正在办公或商业系统的数据......
语音是人类进行相互通信和交流的最便捷的手段。在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储已......
本论文对说话人识别算法进行了研究,主要对基于Mel倒谱系数的矢量量化方法以及说话人确认阈值的估计算法进行了深入的探讨;并在此研......
由于在说话人识别中梅尔频率滤波器组结构分布不均匀,在低频区域分布密集而在中心频率、高频率分布稀疏,影响了在中、高频段的MEL......
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法.该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与......
提出了一种新的音乐分类方法,该方法使用线性判别分析(LDA)和支持向量机(SVMs)对音乐数据进行分类。在实现音乐分类中,先使用傅里叶变换......
设计并实现了一种嵌入式实时音乐语音识别系统。叙述了音乐语音识别系统硬件结构、软件流程,建立了一种基于多频段能量曲线分割结......
被动声目标探测广泛应用于战场目标识别或自动设备的故障探测;通过对声目标的短时信号处理,使用现场可编程门阵列器件的可重构技术对......
低空目标声信号是时变的、非平稳的,若以传统的Mel倒谱系数(MFCC)作为特征参数,虽然能模拟人耳的听觉特性,但不能更好地反映低空声信号......
提出了采用模糊有向图支持向量机(FDGSVM)对基于输出的多语言语音样本进行语音质量评价的一种新方法.将多个可进行两类分类的模糊支持......
隐马尔可夫模型(HMM)广泛应用于说话人识别系统中,主要研究了HMM与自组织人工神经网络(SONN)相结合的混合模型HMMNN,并分析构造了基于HMM......
研究实用的机器人汉语语音识别系统,对于机器人的广泛应用具有重要意义.利用TMS320VC5416DSK板为平台,可实现一种机器人的汉语语音......
在基于智能卡的说话人确认系统中,实现了一种新的端点检测方法:能频值端点检测方法,其取得了较好的效果;在鲁棒性方面,研究了Mel倒谱系......
语音识别领域已经取得了稳步发展并出现了众多实用系统,但众所周知,今天的识别技术还远没有达到要求,而'鲁棒性'问题是系......
为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(Digital Signal Pr......
介绍一种基于浮点型数字信号处理器(TMS320C6713),并通过语音识别说话人身份的实用系统。为构建一个稳定实用的基于DSP说话人识别系......
为了研究模糊聚类算法在高斯混合模型(GMM)参数获取方面的应用,采用模糊C均值算法(FCM)进行语音特征矢量的聚类,并结合Tabu搜索算法得......
声纹识别是生物特征识别领域的一个重要分支。它采用语言数据自动地鉴定测试者身份。本文研究复杂背景下的声纹识别系统的设计与实......
提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+α△MFCC+β△△MFCC为特征......
说话人识别是根据检测到的语音进行说话人身份的认证.是将待识别语音与数据库中的说话人语音进行匹配的过程。设计基于高斯混合模型......
采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别......
为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参......
为了较好地实现数字语音识别,运用隐式马尔科夫理论研究数字语音识别系统,通过软件编程研究其在语音识别系统中的应用。在VC++6.0环......
受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以M......
针对传统语音情感特征参数在进行情感分类时性能不佳的问题,该文提出了一种基于变分模态分解的语音情感识别方法。情感语音信号首......
声母识别在构音障碍评估中有重要临床意义,而声母时长短、不平稳,传统方法的识别效果不理想。本文使用小波变换对声母信号进行多尺......
为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系......
为改善低信噪比环境下语音的质量,在传统MFCC特征提取的基础上,提出了两种提高识别系统鲁棒性的方法。一种方法利用混合窗函数对旁......
为了较好地实现数字语音的识别,运用隐马尔可夫理论研究数字语音识别系统,通过软件编程研究其在语音识别系统中的应用,在Matlab环......
为便于指挥员使用指挥信息系统,提高指挥员的指挥效率,提出了语音识别指挥员喊话命令的方法。针对指挥员命令特点,从命令语音预处理、......
Mel倒谱系数(MFcc)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音......
语音转换是一项非常复杂的技术,语音特征参数的选取是语音转换能否成功的关键。本文基于语音信号个性特征,主要针对超音段特征和音段......
提出了基于多元自适应回归样条法(Multivariate adaptivereg ression spline,MARS)的语音清晰度客观评价方法。该方法提取语音信号的M......
语种识别(Language Identification)(简称LID)是指通过计算机系统对说话人的语音信号进行自动识别判断,得出语音对应语言种类的技术。......
在语音质量客观评估方法中,通常以Mel倒谱系数作为语音特征参数。但是Mel倒谱阶数的变化对评估效果有着直接的影响,同时Mel倒谱系......
提出一种新型车载语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识......
说话人识别是以话音对说话人进行区分,从而进行身份鉴别与认证的技术.介绍了在工厂自动控制系统中说话人识别技术的应用,包含其原......
呼吸系统是维持生物体正常运转和机体新陈代谢的重要系统,任何肺部疾病的发生必定会导致呼吸系统的异常,由于我国呼吸系统疾病死亡......
设计并实现了一种嵌入式语音识别系统.硬件核心处理器是ADSP2181,语音接口芯片为AD1847.软件模块包括语音端点检测、MFCC求取、动......
给出了一个嵌入式小词汇量非特定人语音识别系统的方案,它基于单片微控制器加数字信号处理器(MCU+DSP)架构,用离散隐马尔可大模型方法实......
通过提取基音频率、明亮度、带宽、过零率、响度、均方根、相邻点之间距离的均值和方差及Mel倒谱系数这8个特征构造特征集,在此基础......