【摘 要】
:
声纹识别凭借其安全、便捷的特点逐渐成为一种重要的身份验证手段,广泛应用于公安、电子商务、互联网、金融等行业。声纹识别涉及的技术包括声学、信号处理和机器学习等领域。传统的声纹识别技术主要是基于统计学习的方法,利用高斯混合模型对说话人声音特征梅尔频率倒谱系数进行分类。最近最先进的说话识别技术结合深度学习的技术,识别准确率得到很大的提升。然而,深度学习技术严重依赖于深度学习专家或工程师手工设计的网络。针
论文部分内容阅读
声纹识别凭借其安全、便捷的特点逐渐成为一种重要的身份验证手段,广泛应用于公安、电子商务、互联网、金融等行业。声纹识别涉及的技术包括声学、信号处理和机器学习等领域。传统的声纹识别技术主要是基于统计学习的方法,利用高斯混合模型对说话人声音特征梅尔频率倒谱系数进行分类。最近最先进的说话识别技术结合深度学习的技术,识别准确率得到很大的提升。然而,深度学习技术严重依赖于深度学习专家或工程师手工设计的网络。针对上述情况,设计并实现了基于神经网络架构搜索的声纹识别系统。神经网络架构搜索技术具有巨大的搜索空间,能够搜索出比人为设计更先进的神经网络架构。但是一般来说,神经网络架构搜索技术耗费的资源庞大。为了提高搜索效率,首先提出了一种基于进化算法的新颖搜索策略,即分层进化搜索策略。然后,利用异构感知调度算法将出色的候选结构分配给强大的GPU节点。最后,针对大规模的超级网络训练和子网络再训练,设计了一种稀疏软件加速策略。为了把神经网络架构搜索技术结合到声纹识别里面,采用梅尔滤波器组而不是梅尔频率倒谱系数作为说话人声音的帧级特征,然后利用神经网络聚合帧级特征,形成话语级特征。为了加速神经网络的训练和提高神经网络的精度,在损失函数方面选择最新的广义端到端损失函数。结合以上技术,基于神经网络架构搜索的声纹识别系统在拥有11个GPU服务器的集群进行了测试。测试结果表明,基于神经网络架构搜索的声纹识别技术在小型的公共数据集VCTK和大型的私有数据集中,表现优于目前最新的基于LSTM的和基于x-vector的端到端系统。
其他文献
无人飞行器在军事、测绘等领域有着广泛的应用。随着计算机、自动化等技术的发展,飞行器的种类越来越多,无人飞行器航迹规划系统完成的任务和需要处理的约束条件也越来越复杂,这对航迹规划系统提出了极大的挑战。传统的航迹规划方法通常是基于某种启发式的条件,对规划空间进行搜索和遍历以寻找规划解的方法。这些传统的航迹规划方法的一个共同特点是缺乏对规划过的任务进行学习和总结的能力,无法输出可供未来任务规划参考的规划
微分线性变分不等式(DLVI)是一个由常微分方程(ODE)和线性互补问题组成的耦合问题。本文分析了微分线性变分不等式解的存在性、唯一性与扰动性,提出了基于指数积分的时步方法并且分析了其收敛性。该方法利用指数积分格式离散ODE并且在离散的时间点上求解LCP,结果好于标准的时步法。最后我们利用数值实验验证基于指数积分的时步法的有效性。
人民群众的精神文化、体育资源服务的需求随着经济社会的迅猛发展而呈现出差异化和多样化的趋势,公共文化领域建设也受到政府的重视。目前公共文化体育资源服务领域存在着三个较为突出的问题:一是信息发布方式陈旧引起信息不对称,导致服务供需错位,例如仍然停留在纸质通知或传统WEB网站,难以传达到群众的视野中;二是各个相关机构各自为营,没有统一供给服务,导致服务资源碎片化;三是缺乏有效统计公共文化体育资源服务的使
大专院校是冲压模具制造人才培养的重要基地,对中国制造业良性发展至关重要。目前大专院校冲压模具设计教学主要偏于理论,模具设计教学主要以理论概念和二维图示为主,少数采用三维模具结构设计也是应用通用三维CAD软件进行手工画图。由于冲压模具结构复杂,手工画图效率非常低,大量的时间花在三维CAD软件操作方面,无法专注于模具结构本身,对先进的设计理论和方法也没有很好理解,教学效果不理想。因此,开发一款专门适用
覆冰输电导线在一定条件下,受到风荷载作用会出现舞动现象,引起股线磨损、导线断裂、甚至造成输电塔倒塌,对社会生产生活造成巨大影响。在研究输电线舞动中,常采用索单元模型或梁单元模型进行数值模拟分析,但索单元不考虑抗弯刚度,与实际输电线存在抗弯刚度不符。同时作为输电导线的主要材料—钢芯铝绞线,其力学性能线理论众多,效果不一。而作为螺旋结构的钢芯铝绞线特有的拉扭耦合效应研究较少。因此建立准确的仿真模型和研
铝合金过渡端框架是分级火箭过渡段的主承力构件,用于实现火箭级与级之间的连接,在火箭发射过程中起着重要作用。目前主要是通过将锻件毛坯进行机加工减材的方式来生产过渡端零件,生产效率低,生产成本高,已经无法满足我国运载火箭高频率、多种类的使用需求。电弧增材制造是一种以电弧为热源的新型制造方法,具有效率高、成本低等一系列优点,能够很好的满足尺寸大、结构复杂金属零件的制造,近年来已近在航空航天等领域取得了较
伴随着我国城市机动化的发展,儿童生活日趋室内化、静态化,城市规划亟需响应儿童健康成长的需求,构建宜居的社区成长环境,以引导积极的生活方式。现有研究多单一针对主观或客观建成环境数据进行研究,较少从两者相结合的角度探究对儿童户外活动行为的影响,往往造成研究问题的不全面,亟待开展主观和客观两种建成环境数据共同作为解释变量对儿童户外活动的影响研究。首先,本文通过对国内外建成环境与儿童户外活动的相关研究进行
随着互联网技术的发展以及5G技术的出现,用户对多媒体和宽带新业务的需求逐渐增加,这就需要高带宽高效率光交换网络的支持。而可调谐激光器是高速光交换网络中的核心光电子器件。同时可调谐激光器在传感、激光雷达等领域有着重要的作用。虽然目前已有多种可调谐激光光源问世,但是都存在一定的缺点。面对巨大的需求,如何低成本高效率地制造可调谐激光器,并且提高它的调谐性能无疑具有重要的研究意义。本论文基于重构等效啁啾技