基于多流动态贝叶斯网络的音视频连续语音识别

来源 :西北工业大学学报 | 被引量 : 5次 | 上传用户:kmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对说话时发音和口形的异步问题,提出了一个多流异步动态贝叶斯网络(DynamicBayesian Network,DBN)模型,以实现基于音视频特征的连续语音识别,在这个模型中,音频流和视频流在词节点同步,而在词节点之间,音视频流有各自独立的拓扑结构以及节点变量之间的条件依赖关系,同时词转移节点变量由音视频流共同确定,模型在词级别上体现了音视频流的异步性。采用连续数字音视频数据库的实验结果表明,在信噪比为0~30 dB的测试环境下,比较单流DBN模型和多流隐马尔可夫模型,平均识别率分别提高了8.68
其他文献
目的 研究不同剂量丙泊酚用于门诊无痛胃镜检查时对认知功能的影响。方法 选择胃镜检查患者40例,随机均分为A、B两组。两组患者均在胃镜置入前静注芬太尼1μg/kg,3min后A组静注
带状疱疹(herpeszoster)目前治疗方法较多,各有优点。但尽快消除疼痛,加快疱疹消退,减少带状疱疹后遗神经痛(postherpeticneuralgia,PHN),仍然是治疗中的主要问题。我院从2007年1月至2
设计并完成了用于自主水下航行器(AUV)导航控制软件的开发与系统测试的半实物仿真系统。该半实物仿真系统由实时仿真计算机和真实的导航控制计算机构成,实时仿真计算机完成AUV空
遥感图像融合过程中,为了在增强空间分辨率的同时减少光谱损失,文章提出了一种改进的强度-色调-饱和度和小波的融合算法,新算法在原算法中,引入正则化技术。以小波域局部高斯模型作为光谱分布先验概率,以全色图小波系数做为空间分布先验概率,以马尔可夫随机场描述空间特征,通过梯度下降法迭代优化,实现了光谱和空间信息总损失最小的图像融合。对美地球资源卫星5的增强专题图像的融合试验证明文中提出的算法可同时提高多光
目的研究氯普鲁卡因用于小儿骶管麻醉的可行性与安全性。方法62例在骶管麻醉下行下肢或会阴部手术患儿(3~8岁),随机、双盲均分为氯普鲁卡因组(研究组)和利多卡因组(对照组),每组31例。