基于预训练的网络流量分类与对抗样本攻击研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:yijun5802382
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人民生活水平的提高,互联网上的网络流量也呈显著增长。但由于网络环境错综复杂,如何对流量进行审查和管理成为了国家有关监管部门、运营商以及企业内部等单位的重要关注事件。目前,较为流行的网络流量分类方法是基于深度学习的方法,其避免了对专家提取特征的依赖,且能通过多层神经网络提取流量更深层次的特征,有效提升了分类的准确率。但是,一方面,基于深度学习的网络流量分类仍存在分类准确率性能提升有限的问题。另一方面,深度学习技术容易被不法分子滥用来捕获用户的流量,从而分析用户隐私。因此如何生成有效的流量对抗样本以在正常行使应用功能的前提下保护用户隐私也是一个重要问题。本文将对这些问题进行实验和探讨。针对上述已有基于深度学习的网络流量分类中存在的分类准确率性能提升有限的问题,本文从自然语言处理领域的预训练模型受到启发,提出了一种字节嵌入向量的流量表征方式,以及基于预训练方法的网络流量分类模型OCEPT。跟已有方法中只使用带标流量数据集不同,我们的模型综合利用了大量易得的无标流量数据和少量带标流量数据。本文提出的模型包含2个模块,第一块是预训练部分,其将大量无标流量数据输入到预训练模型中充分训练,以学习流量字节的上下文语义表示,并提取出训练好的字节嵌入向量。第二块是分类部分,将训练好的嵌入向量输入到下游任务的网络流量分类器中进行微调。在ISCX VPN-non VPN 2016数据集上的实验结果表明,本文提出的基于预训练的网络流量分类方法,能够有效提高网络流量分类器的准确率和召回率等性能指标。针对如何生成有效的对抗流量样本问题,本文借鉴了图像领域中基于集成方式的黑盒对抗样本生成策略,提出了一种新颖的适用于黑盒场景中的定向流量对抗样本生成方法E-ASGT。我们提出的方法基于一种假设,即如果生成的对抗样本可以欺骗多种分类模型,那么它有更大的概率欺骗未知的黑盒模型。基于此思路,我们首先选择若干个白盒流量分类模型作为替代模型,计算原始样本在多种分类器下的softmax输出,然后计算每个模型的输出和目标标签的损失值,损失值加权后再将损失反传,最后调整对抗样本的值。经过多次迭代,当损失函数收敛时,得到对抗样本。在QUIC流量数据集上的实验结果表明,使用我们所提出的方法生成的流量对抗样本能有效欺骗黑盒流量分类器。
其他文献
结直肠癌是全球范围内最广泛存在的癌症之一,由于其病程发展缓慢,早期诊断对能否通过手术的方式获得根治起着关键性作用。内镜检查是目前检测癌前病变的金标准,但其侵入性强、流程复杂等缺点阻碍了内镜检查成为大规模人群早筛检查的手段。基于拉曼光谱的液体活检方法能够识别血清中由癌症发生或早期进展带来的分子和细胞变化,具有无侵入、简单高效等优点。然而血清拉曼光谱成分复杂、信噪比低且数据标准化程度低,使得现有算法精
学位
碳氢燃料主动冷却技术是高速飞行器高温部件热防护的有效途径之一。碳氢燃料热裂解吸热反应能提供不可或缺的化学热沉,但同时不可避免地产生结焦现象。结焦是碳氢燃料参与发动机主动冷却、决定燃料工作边界的瓶颈难题。深入研究碳氢燃料热裂解结焦机理、动力学模型,以及冷却通道结构对热裂解结焦的影响,具有十分重要的理论意义和应用价值。采用电加热实验研究了典型碳氢燃料圆形冷却通道内的热裂解结焦行为。实验发现,出口温度为
学位
氢能作为一种清洁能源,具有其他能源所不具备的多种优点:能量密度高、储量丰富、绿色无污染等,是理想中的一种可替代化石燃料的新型能源。而光催化制氢技术是将太阳能转化为氢能的一种理想途径。光催化制氢技术的重点在于高效光催化剂的开发,有机光催化剂目前在光催化领域引起了许多研究人员的注意,具有丰富的种类、可自由调节的分子结构、优异的可见光响应和制备简单等优点。但是,有机光催化剂的光生载流子分离效率低且易复合
学位
从2021年7月,《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(简称“双减“政策)颁布实施后,中国的教培行业企业面临业务萎缩,转型,停业,甚至现金流断裂而破产等困境。教培行业企业如何应对宏观政策和市场的变化?如何制定、实施战略转型并得以可持续发展呢?本文以XDF公司为案例,通过用分析、选择、实施、检验的思路分析其战略转型的过程,在分析阶段以PESTEL分析法和波特“五力模型”的要
学位
楼宇和建筑工业约占全球三分之一的能源消耗和碳排放,而且这一数字预计将会随着城市化进程继续增加。因此,在能源系统数字化改革和低碳转型不断推进的背景下,智慧楼宇能量管理受到越来越多的关注,它可以有效地降低能源的运行成本并提高效率,使楼宇在能耗成本、碳排放和用户舒适度方面达到最优的权衡。与此同时,区域内多能耦合和信息交互进一步深化,逐渐建立起各个层级的综合能源系统。综合能源系统可在满足区域内冷、热、电、
学位
故事教学法广泛应用于外语教学领域,其研究文章也层出不穷,而针对汉语的故事教学法研究则相对较弱。基于此,针对国外尤其是俄罗斯高校汉语课堂的故事教学法进行系统研究就显得尤为必要,以此研究为契机,还可验证故事教学法对俄罗斯高校汉语教学的整体意义。本文在系统考察俄罗斯高校汉语教学目前状况的基础上,通过访谈了解到教学中存在的问题,利用查找文献、问卷调查等方式详细分析问题的根源。通过研究认为,因俄罗斯高校汉语
学位
<正>寒冬时节,广西北海市铁山港区海域的深水网箱养殖金鲳鱼迎来好收成,渔民们正加紧进行冬季捕捞作业,海面上呈现一派鱼跃人欢的丰收景象。据了解,深水网箱养殖是北海市的特色海洋产业。当地通过采取出让海域等优惠政策,鼓励有能力的企业及个人参与投资建设深水网箱养殖。
期刊
癌症是对人类健康的严重威胁,每年有多达上百万人死于恶性肿瘤。许多恶性肿瘤目前还没有治愈的方法,但有些可能经过早期诊断确诊,就能挽留很多人的生命,因此这就要求发展更加先进的生物成像技术对癌症进行诊断,以便更精确更及时地进行治疗。目前,鲁米诺的化学发光特性已被应用于体内炎症成像,癌症环境中产生的活性氧(ROS)可以与鲁米诺反应产生化学发光,由此可以测定炎症的不同阶段。但是由于其在体内的组织穿透能力有限
学位
近年来,随着我国经济的发展和居民收入水平的不断提高,人们的教育理念也随之改变,人们不仅关注应试教育下学业能力的提升,更加重视素质教育下德智体美劳等多维度的发展与培养,并且对艺术类教育培训的热情也是不断高涨。新生代家长们有眼界也有财力去培养孩子各方面素质和综合能力,教育相关消费已然成为一个家庭培养孩子的重要支出。而“双减”政策的出台和实施为艺术教育培训行业的发展注入了了活力与机遇,同时也带来了诸多挑
学位
房地产是以开发、运营、管理以及服务为主的行业,其中主要涉及生产、消费以及流通三个领域。目前依然是我国经济发展的重要组成部分,对基建、金融、工业等行业存在明显的影响。当前,学者们对住宅类房地产风险管理进行了系统性的研究,获得了较多的研究成果,但是对商业地产风险管理的分析相对不足。与普通住宅相比,商业地产不管是从功能、用途、运营模式,还是从资金周转方面来看,都存在很大的风险。另外,商业地产主要是以租赁
学位