【摘 要】
:
过去的几十年中,语音增强技术蓬勃发展。从传统的无监督方法的应用,到深度学习方法的兴起,语音增强相关方法虽已有颇多成果,但仍存在无限潜力。本文围绕目前应用最广泛的单通道语音增强技术展开研究。本文首先对传统无监督单通道语音增强方法,包括谱减法,维纳滤波法和卡尔曼滤波法进行了实验研究,评估了它们在平稳及非平稳噪声环境下的语音增强性能,分析了它们在非平稳噪声环境下性能差的原因。随后,提出了基于掩蔽预测网络
论文部分内容阅读
过去的几十年中,语音增强技术蓬勃发展。从传统的无监督方法的应用,到深度学习方法的兴起,语音增强相关方法虽已有颇多成果,但仍存在无限潜力。本文围绕目前应用最广泛的单通道语音增强技术展开研究。本文首先对传统无监督单通道语音增强方法,包括谱减法,维纳滤波法和卡尔曼滤波法进行了实验研究,评估了它们在平稳及非平稳噪声环境下的语音增强性能,分析了它们在非平稳噪声环境下性能差的原因。随后,提出了基于掩蔽预测网络的单通道语音增强方法。构建两个深度神经网络:掩蔽预测网络和辅助网络。将混合带噪语音和相应的纯净语音分别作为掩蔽预测网络和辅助网络的输入,运用添加了注意力功能的辅助网络来生成各相关时刻的语音参数信息,以引导掩蔽预测网络的训练。最后,提出了基于频谱映射网络的单通道语音增强方法。该方法利用语音信号的频域信息,通过级联添加掩蔽输出层的谱映射分离网络和特征提取网络,来实现语音频谱和噪声频谱的分离。该方法将注意力机制嵌入到深度神经网络中,在非平稳噪声环境下拥有更强的语音性能提升效果。
其他文献
本课题就古医籍中和现代共有的具有代表性的茶叶品种其养生理论相关条文进行辨析收集、归纳整理,探讨茶叶的历史源流、茶叶养生的历史概况、茶叶的品种和分类、性味和功效、体质配伍、现代化学成分分析及合理饮茶等,以明确茶叶体质养生的内涵、理论基础、原则等,个性化指导茶叶养生。研究目的:归纳整理历代古籍文献中关于茶性、茶效的记载,探究茶叶体质养生的理论依据,从而指导茶叶体质养生的方法与应用。研究意义:1.可以进
水资源系统是一个较为复杂的开放性巨系统,水资源系统中相关问题的分析评价及决策涉及到系统的各个方面,科学合理地求解指标权重进而构建精准有效的评价模型是为水资源规划管理提供决策支持和信息支撑的前置性条件,对于水资源与经济社会的协调永续发展具有重大意义,也是当前水资源决策者面临的紧迫任务和重要课题。论文在对水资源系统分析评价问题的复杂性特点及权重合理求解的重要性进行研究的基础上,针对水资源系统分析评价中
随着我国人口结构的变化,老龄化逐渐加剧,对社区护工的需求也日渐增加,通过建立社区诊所护工管理系统,在护工与被护理者之间搭建一个平台,能极大的优化护工与被护理者的关系。该系统能最大程度的优化病人与护工之间的资源,满足被护理者与护工之间双向选择的需求,也为建设管理有序、服务完善的基层医疗卫生服务中心提供了思路。本文首先通过对相关文献进行查阅,阐述了研究背景和本文的主要工作内容,并对本文的组织结构进行了
小型无人共轴双旋翼直升机因其载荷能力强、结构紧凑且具有悬停、垂直起降、高速飞行等能力而被广泛应用在军事、农业和科学研究等领域,这些应用需要共轴双旋翼直升机具有可靠和稳定的自主、半自主飞行控制系统,因此研究小型无人共轴双旋翼直升机的飞行控制具有巨大理论意义和应用价值。由于小型无人共轴双旋翼直升机系统的强耦合、欠驱动、开环不稳定、时变参数、强非线性、高阶多变量等特性,使得对于小型无人共轴双旋翼直升机的
在“三全育人”视域下探索课程思政建设,有利于全面提升大学生个人素养,促进高校教育在落实国家教育方针的基础上更好地完成“立德树人”根本目标。“三全育人”从育人主体、育人过程及育人方位等层面为课程思政建设提供方向指引,确保课程思政建设的有效推进。当前,高校落实课程思政、践行“三全育人”理念,面临一系列困境,育人主体对课程思政认知的不深入、育人理论知识和实践技能的不足、育人制度的不完善、育人资源安排的不
针对传统数据仓库在建筑企业全域数据治理存在的问题,构建基于数据中台进行数据治理的架构,设计异构数据源的采集方案,建立离线和实时开发的数据治理模型,提出API、数据库同步及多租户的数据共享方式,比较不同数据治理架构的优缺点,实验表明数据中台架构对建筑企业全域数据治理是有效可行的。