【摘 要】
:
作为多媒体媒质之一的音频信号几乎无处不有,它有效的丰富和补充了人们在信息社会的语义感知和获取.但当前人们对多媒体信息检索获取仍是以视觉为主要途径,特别是常以文本方
论文部分内容阅读
作为多媒体媒质之一的音频信号几乎无处不有,它有效的丰富和补充了人们在信息社会的语义感知和获取.但当前人们对多媒体信息检索获取仍是以视觉为主要途径,特别是常以文本方式进行检索,而基于大量音频信息库的检索形式却未能引起人们的足够重视.为此,该文针对音频检索问题展开了讨论,从音频信号特征提取着手,分析了音频信号的时域和频域特征以提取短时能量、短时过零率、短时能频值和Mel系数等为特征数据,把音频信息流分割为广告、主持人介绍、天气预报、足球比赛、音乐或戏曲等六大类.利用具有较强的时间序列结构建模能力的隐马尔可夫模型和具有并行性、强分类能力的BP神经网络实现了广播电视节目音频信息流分类检索.同时考虑到基于梯度下降法的BP算法训练速度慢,为加强检索手段的时效性,我们进行了BP算法加速收敛的分析应用,得到了适用于音频检索的改进BP算法,数值实验结果表明有效性.
其他文献
随着非线性科学的迅速发展,寻找非线性偏微分方程的精确解在孤子理论中扮演着重要的角色。Painlevé截断展开法和函数展开法是求解非线性偏微分方程两种非常简单且有效的方法
本文讨论了n-marked黎曼球面模空间m上自然的对称群作用,这里n阶对称群S通过置换marked点而作用在其上. 这一作用是非自由的.该作用下的不动点集和相应的局部群反映对应的对
本模型的基本假设是公司以其价值最大化为目标来确定其财政政策和投资政策,同时,这也是投资者的唯一目标。该模型的基础是Cox,Ingersoll和Ross(1978)的资产价值评估偏微分方程组,该方程组是在证券价格函数与理性期望相一致的假设下,运用Black-Scholes模型得到的。我们运用该模型来分析某一假想公司的财政政策和投资政策。 本文用显示差分格式给出了方程组的数值解,证明了差分格式的
本文主要讨论两方面的内容.一是二阶差分方程周期和反周期边值问题的特征值,二是复离散哈密顿系统的Prüfer变换和三角变换. 对于微分方程周期和反周期边值问题的特征值,Cod
设G为有限群,k(G)为G中元素共轭类的个数,πe(G)为群G中元素阶的集合。则存在非负整数k使得k(G)=|πe(G)|+k.我们称该群为co(k)群。Syskin在1980年提出著名猜想:在一有限群G中,若
本文考虑下列非椭圆非线性Schrodinger方程iut+n∑j=1∈j2ju+K(t,x)|u|αu=0,u|t=0=ψ0.的柯西问题,这里K(t,x)为已知实值函数,t∈R,x∈Rn,n≥2,0<α≤4/n,∈j∈{-1,1},1≤j≤n,i=-1.已知
本项目设计采用国外最先进的通信芯片产品和技术开发研制无线式数字远程智能电子自动专家评审系统,可由专家进行准确、快捷的各种奖项评审。研制成的无线式数字远程智能电子
激光扫描技术因具有高分辨率空间数据获取的特点,正逐步成为建筑物三维重建以及数字城市中新的研究热点。然而激光扫描仪采集的点云数据量巨大,给计算机处理带来挑战。目前针对海量的点云数据,研究高效准确的重建方法仍处于探索阶段。为此,本文以建筑物的三维重建为背景,重点研究了地面激光扫描数据中建筑物点云的分割以及建筑物立面结构中平面特征提取方法,主要工作如下:1.针对地物点云相连问题,本文提出了基于圆柱体邻域