音频分类技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zbiao1222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音和音乐是最重要的两类音频信息,音频信息处理在多媒体信息处理中占有重要地位。由于音频信息本身的特点,音频分类技术对于音频结构化有至关重要的作用,直接关系到对音频信息分析的深入程度和准确程度,以及音频内容语义的提取。本文的主要工作和研究成果包括以下几个方面:(1)介绍了联合语音/音频编码的思想和实现框图,详细分析了一种音频clip和音频帧结合的音频特征分析与抽取方法,介绍了各种分类器与分类算法的设计,并简单介绍了两种典型的语音、音频编码器:码激励线性预测(CELP)和先进音频编码(AAC)。(2)详细分析了现有的两种音频分类算法:基于LPC的音频分类算法和基于基音强度的音频分类算法,并通过实验对比其计算复杂度及分类准确率。(3)在分析心理声学模型的基础上,利用心理声学模型1分析和抽取音频信号的音调特性(音调个数、低音调帧比例或子带音调个数比),并分析音频信号的时域特征参数(过零率或频谱倾斜度),提出了一种基于音调特性的音频实时分类算法。设计并对比多种实现方案的分类性能,得到最佳方案:利用子带音调个数比和频谱倾斜度对语音和音乐进行分类,并对分类结果进行平滑处理。(4)通过实验对比分析了本文提出的音频分类算法与现有算法的分类性能。实验结果显示,本文提出的音频分类算法较现有的分类方法有很大改进,有效地降低了计算复杂度,提高了分类精度,并实现了实时分类。因此,实用性较强。
其他文献
以"中国地壳运动网络观测"工程1999~2001年GPS观测数据为基础,应用GAMIT/GLOBK软件对数据进行精密解算,获得了青藏块体东北缘1999~2001年相对于欧亚板块的水平运动速度场.结合
随着建筑行业的发展,在越来越多的建筑中出现了地下室,地下室的出现在很大程度上扩大的使用的空间,但是地下室的防水效果也比较差,在建筑工程中,对地下室的质量控制一直是重
目的对育龄期月经过多女性患者进行出血性疾病的筛查和病因学分析。方法对102例育龄期月经过多女性患者进行出血性疾病的筛查,收集患者的病史、家族史,并分别进行全血细胞计
<正>免疫性血小板减少症(immune thrombocytopenic purpura,ITP)是一种获得性自身免疫性出血性疾病,以免疫介导的血小板减少为特征。已知ITP主要机制是自身抗血小板抗体的产
<正>1概述我公司热动力厂以污氨水为吸收剂吸收锅炉烟气中的SO2生成亚硫酸铵,亚硫酸铵溶液再经过空气氧化、蒸发浓缩、降温结晶、离心分离等工序生产出硫酸铵产品。在上述工
城市交通信号控制系统对于交通的调节和疏导具有重要的作用,信号灯控制系统作为主要的信号控制系统,主要采用定时控制的方式,对交通流量进行控制。文章采用西门子的S7-200实
<正>一公元前11世纪,周王朝取代殷商王朝在中国土地上建立了自己的王朝。直到春秋时期,中国都是以农耕文化为中心,即一家一户小农经济为主的社会结构。这种小农经济生产方式
<正>我公司的型煤生产和使用经过十几年的发展和改进,直到2012年,型煤的产量和质量才真正得到根本的提高,生产转入稳定,型煤质量、造气煤耗由原来的落后水平进入到全国先进水
<正>震泽蚕丝被有着悠久的历史文化,明代嘉靖年间蚕丝被曾作为宫廷贡品,而民间女儿出嫁,亲戚都要送蚕丝被作为礼金的一部分。7月7日,湛蓝天空中朵朵白云如棉花般散布,缓缓流