面向重放攻击检测的网络嵌入特征提取方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhangfuliangez
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动说话人验证(Automatic Speaker Verification,ASV)旨在验证说话人所声称的身份是否真实,是目前广泛应用的生物识别技术之一,与指纹、人脸等生物识别技术相比,具有非接触、无需光照等优点。然而,随着应用系统对说话人验证技术依赖程度和信任度的提高,如何防范可能面临的各种攻击,是ASV应用系统必须解决的一个重要而困难的问题。重放攻击是指通过重放窃取/录制的目标说话人语音来冒充目标说话人,是一种常见的说话人验证系统攻击手段。而传统的ASV技术很难辨别这种攻击。因此,需要研究专门的技术手段来检测这种攻击。本文针对说话人重放攻击检测问题,着重研究有效的特征提取方法,以期达到有效检测重放攻击的目标。论文主要工作内容如下:1)提出了一种基于时延神经网络(Time Delay Neural Network,TDNN)的嵌入特征提取方法。采用TDNN网络提取嵌入特征,使用聚焦损失函数解决训练数据中数据失衡问题,并用softmax进行最终的攻击检测分类。与传统的基于逆梅尔倒谱系数(Inverted Mel Frequency Cepstral Coefficient,IMFCC)特征的高斯混合模型(Gaussian Mixture Model,GMM)方法相比,该方法在评估集的最小串联检测函数(Minimum Tandem Detection Cost Function,min-t DCF)与等错误率(Equal Error Rate,EER)两项指标分别提高了10.28%和15.87%,取得了较好的效果。2)提出了一种融合多种段级别嵌入特征,从而提高重放攻击检测性能的方法。首先,提取反映环境与设备信息的嵌入特征,并将其与TDNN嵌入特征融合,然后,通过融合多个段级别的嵌入特征来提升检测性能。实验结果表明,融合特征比单一特征的min-t DCF与EER指标分别有13.95%和11.38%的相对提升。3)提出了一种基于对抗训练的说话人无关嵌入特征的提取方法。为尽量减少所提取特征中包含的说话人信息,从而减少说话人信息对重放攻击检测的干扰,采用对抗训练机制,使提取到的嵌入特征尽可能不包含说话人信息。实验结果表明,该方法的检测性能超过前述两种方法,能更有效地检测说话人重放攻击。
其他文献
摆动转子压缩机是滚动转子压缩机的孪生结构,随着制冷工质的发展,研究人员发现摆动转子压缩机具有承受更大压力差的优点,比滚动转子压缩机具有更明显的优势,因此在部分空调压
喇嘛甸油田一类油层聚合物驱已全面转入后续水驱,2007年10月开始,通过对二类油层高浓度聚合物驱的推广,通过对油水井近几年的油水井精细调整和实践,我厂北东块几个二类油层高
共轭亚油酸(Conjugated linoleic acid,CLA)是一系列具有共轭双键的十八碳二烯酸。作为一种新型的具有广泛生物活性的功能性脂肪酸而备受关注。目前,CLA的规模化生产主要利用
随着互联网技术的普遍与发展,世界进入了信息爆炸时代,计算并分析大规模密集型科学数据已成为数据挖掘的新趋势,而文本挖掘作为数据挖掘的主要方面,也已经成为知识发现的新方
近年来,随着城市化进程的快速发展,城市规模逐渐扩大、人口数量迅速增加导致了水资源供需矛盾日益突出。地表水和地下水污染、水资源空间分布不均匀和全球气候变化引起的干旱
压裂技术是低渗透油田增加单井产量,保证油田产量稳定,并从中提高经济效益的一项重要措施。他拉哈地区油藏具有油层埋藏深、油层物性比较差、丰度比较低、小层发育多、每个单
近年来互联网的快速发展,人们每天都能接触到大量的文本,信息爆炸式增长产生了海量的数据。面对这些海量的文本数据,如何快速的浏览和选择所需要的内容,有效的节约阅读时间已
S油田P区块东、西两翼油水过渡带开发面积较大,地质储量占整个P区块地质储量的16.65%。70年代开始陆续采用300-400米不同注采井距的面积井网投入开发。目前过渡带地区经过整
目标跟踪技术是计算机视觉领域的一个研究热点,有着重要的研究意义,在视频监控和无人驾驶等许多领域都有着广泛的应用前景。尽管目标跟踪技术已经取得了较大的进展,但由于跟
语音信息隐藏技术是将秘密信息嵌入至可以对外公开的实时通信语音流中,从而实现保密通信的目的。在基于语音流载体编码过程的信息隐藏方法中,为了保证嵌入秘密信息的不可感知