VoIP语音库的体系与生成方法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:masterwhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的发展,网络上的流量迅速增加。然而随着安全性的需求和网络流量加密传输的广泛使用,对网络流量进行加密已经成为了一种标准。目前,越来越多的学者围绕网络流量展开研究,研究网络流量的分类与识别。然而网络电话也已经成为一种成熟的通讯技术,网络中的VoIP流量越来越多。但是目前用于研究的数据集还是以IDS(入侵检测)和网络流量应用分类为主,可用于加密语音流量识别的VoIP数据集比较缺乏。当前,在借助VoIP软件生成数据的方式下,想要获取准确、多样化标签的流量是一件困难的事情,因此研究具有准确标签的VoIP流量数据集生成方法显得尤为重要。为了能够获得标签种类多样化、准确的VoIP流量数据集,本论文主要完成以下工作:1)本论文首先研究VoIP中的相关协议,如H.323、SIP、SDP协议,确定了基于SIP协议的VoIP流量生成路线。SIP协议中使用的网络安全机制也是研究对象之一。SIP协议中的安全机制偏向于保证SIP中的信令流安全,媒体流的安全是通过SRTP协议实现的。为了了解SRTP的工作流程,本文研究了 RFC3711。研究发现SRTP中需要一个主密钥,而主密钥的协商需要使用MIKEY、SDES等密钥协商管理协议。SRTP协议中采用了基于AES128的数据加密方式。2)研究目前用于语音识别的数据库的特性,提出了用于VoIP语音识别的语音库体系构成,从发音文本设计、录音人的选择等角度讨论语音库的设计标准。3)在前三点的研究基础上,本文对VoIP流量的生成有了完整的系统性认识,结合目前VoIP流量产生的缺陷和实际需求,提出了一种使用WAV文件作为语音源的VoIP流量生成方法。研究网络层次中各协议的报文头格式,通过网络协议报文头的封装,达到流量生成的目的。实现了 AES128的计数器工作方式。4)为了能够提高VoIP流量的标签标注工作的自动化程度,提出了一种基于DNN的说话者性别识别方法和基于CNN的语种识别方法。5)通过系统的测试,生成的流量报文能正确被Wireshark软件识别,表明数据封装的正确性。基于DNN的说话者性别识别实验结果表明通过提升MFCC的维度或者语音数据的时间长度,都能提高识别的准确率。而基于CNN的语种识别也有90%以上的准确率。
其他文献
以诱变选育的1株突变菌株丙酮丁醇梭菌XY16为对象,对影响该菌发酵特性的相关因素(N源、生长因子、热激)进行研究。结果显示:无机N源乙酸铵比其他N源更有利于丙酮丁醇的发酵,玉米浆
近日,作为中国公路养护设备行业领跑者之一的河南高远圣工依靠雄厚的研发实力成功研制出国内首台排水性路面机能恢复车,解决了排水性沥青路面养护这一难题。GYPJH2000排水性路
文章结合实例详细介绍了高速装载机油气悬挂系统的组成和工作原理,通过理论分析提出了合理使用与正确维护这种悬挂系统的方法,并对可能发生的故障与原因也进行了阐述。对此类装
第十届北京国际工程机械展览与技术交流会(BICES2009)于2009年11月3-6日在北京九华国际会展中心成功举办。百莱玛全资下属机构德基机械在此次展会现场举行了其DG5000型沥青混合
介绍了甘蔗糖厂压榨蔗层厚度自动控制系统的应用。系统以PLC为控制核心,使用接近开关检测蔗层厚度,通过控制输蔗带速度实现碎蔗均衡输送,通过榨机高位槽料位高度检测控制榨机速