面向加密和对抗的自然语言安全技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:windyson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的普及,网络用户迅速增长,网络环境也日益复杂。为处理网络中成倍增长的数据,各式各样的互联网技术也随之出现。无论在网络上还是日常交流中,语言自出现伊始便一直担任着人们交流的媒介,应用于人们生活的方方面面。为了处理网络环境下的大量语言文本信息,自然语言处理技术开始出现并迅速发展,随后广泛应用于网络数据的处理。如基于分类任务的情感分析,新闻分类和基于生成任务的文本摘要和机器翻译等。但自然语言技术不仅能够作为人们日常生活的辅助,还能够维护网络环境的安全与和谐。本文提出了两种将自然语言技术应用于安全领域的方法。对于在网络环境中,保护用户的个人隐私信息领域,本文尝试利用语言的语义信息代替生物信息生成密钥序列用于加密,首次将语义信息与密钥技术相结合,提出了语义密钥概念和语义提取+特征稳定+模糊提取的语义密钥生成框架。在该生成框架下通过改进后的BERT-Remap模型和Unet-NCC模型搭建出语义密钥生成模型SKEM。改进后BERT-Remap模型能使向量更好的表示语句语义信息,Unet-NCC模型则能更有效的完成特征稳定,因此,在人工造句的实验环境中,SKEM模型生成的语义密钥准确率可达99%以上,同时保持错误率低于0.5%,在与其他该生成框架下模型的对比中,均取得最佳效果。对于净化网络环境,提高网络中不良文本过滤模型性能领域,本文提出了通过对抗样本生成扩充不良文本数据集,提高过滤模型性能的方法。提出了基于GPT2的对抗样本生成方法。利用GPT2模型对语义信息的把握,挑选出语句中对语句语义及分类结果影响最大的词语进行扰动,并提出了谐音,视觉,字母三种扰动方式以及两种添加扰动的方法。最后,通过语义相似度阈值筛选出与原始样本语义一致的对抗样本。该方法生成的对抗样本在与原始样本语义相似度超过0.7的条件下,能够使作为分类器的LSTM模型准确率下降超过30%。将对抗样本加入训练集对分类器LSTM模型进行重训练后模型准确率可提升至93%以上。
其他文献
互联网的成熟,提升了社会资源共享的水平,同时也加剧了市场竞争。客户偏好越来越呈现出个性化、多样化和不确定的特征。实体制造业需要采用一种新的生产模式来应对多品种小批量的新型消费模式,单元制造系统以其敏捷、灵活、柔性的优势备受关注。在实际生产中,企业想要最大化地提高产品利润或扩大市场份额,市场和制造两方面均需兼顾。这不仅需要考虑顾客偏好以确定产品线设计的产品变体,还需要考虑制造过程中的资源配置问题。另
学位
近年来,新一代信息技术快速发展,推动传统制造业向智能化方向变革。智能制造作为第四次工业革命的技术核心,成为各国竞争的制高点。2016年,工信部和财政部联合出台《智能制造发展规划(2016-2020年)》,提出促进区域资源配置优化和优势资源互补,以推进区域智能制造协同发展。因此,有必要基于省域视角对中国智能制造发展情况进行剖析,从中发现发展过程中存在的不足,并及时做出政策调整,从而助力中国整体经济持
学位
近年来,外卖行业迅速发展。2019年,中国餐饮外卖产业规模达到6536亿元,消费者规模约4.6亿人,外卖员总数已突破700万人。行业繁荣发展的背后,外卖员的高伤亡率引起社会的广泛讨论。2018年,成都7个月间,外卖员发生安全意外事故196件,伤亡155人次,平均每天就有1名外卖员因意外事故伤亡。外卖员作为行业生产的重要主体,其工作中的不安全行为是造成意外事故发生的重要原因之一,但导致不安全行为出现
学位
随着开放获取运动的开展,学术论文全文、审稿人意见等资料越来越容易被获取,这些文本资料中蕴含着大量的有用信息,可以为学术论文创新力评价提供新的视角和方法。同时,随着自然语言处理技术的不断成熟,其应用领域也在不断扩大,越来越多的领域都在使用自然语言处理技术来完成特定的研究或工作,在评价计量学领域中,自然语言处理技术的应用也成为了研究的重点和热点。本文借助文本挖掘技术,从审稿人的评论文本中,挖掘出有关创
学位
水资源是人类生存的基础性自然资源,随着工业化和城市化的进程加快,水资源的持续消耗与工业废水排放增加,我国水环境问题日益突出。国际间进行贸易交流时往往伴随着资源的转移,一部分隐含的废水出口到国外或是进口到国内,这一过程中水污染压力随之转移。因此研究我国工业贸易隐含废水排放及其治理机制,亟需从虚拟水视角对工业出口贸易的隐含废水进行测算,明确工业贸易隐含污染中工业废水排放的过程及其影响因素,并对工业贸易
学位
随着当前国际科技竞争态势日益复杂,建设科技强国成为我国实现高质量发展的战略新需求,我国需要依靠自身力量解决科技创新活动“卡脖子”现象与从0到1的原创性成果欠缺的难题。就我国科技创新发展现状而言,我国现仍存在科技资源配置不合理、科技创新投入产出效率低的问题。产学研协同创新的出现打破了创新主体固有的创新模式,创新主体可以通过合作实现技术与知识的有效融合,从而实现科学的科技资源配置,提高科技创新效率。因
学位
第一部分焦亡与大鼠脑缺血再灌注损伤的相关性研究目的:研究大鼠脑缺血再灌注损伤(ischemia/reperfusion,I/R)模型中,NLRP3炎症体相关蛋白包括凋亡相关斑点样蛋白(Apoptosis-associated speck-like protein containing a CARD,ASC),NLRP3,半胱氨酸天冬氨酸酶-1前体(pro-Caspases-1),半胱氨酸天冬氨酸酶
学位
随着高质量共建“一带一路”不断推进,中国企业走出国门,并与“一带一路”沿线市场企业组建了技术标准联盟这一全新的组织方式。面向“一带一路”企业技术标准联盟对于推动中国技术标准引领产品、技术和服务等全要素“走出去”具有重要作用。因此,研究其运行模式和实现路径有助于了解和掌握联盟运行情况,对中国企业如何选择适宜的运行模式,实现高效“走出去”具有一定的实践参考价值。论文分别使用扎根理论研究、系统动力学仿真
学位
信息隐藏作为一种保障信息安全的重要技术,可以在不被第三方察觉的情况下,把信息通过特定的方式嵌入公开载体中并完成信息传递。文本已被广泛应用于日常生活中,成为人们传递信息最常用的媒介之一。文本信息隐藏技术采用文本作为隐藏信息的载体。早期的文本信息隐藏方法大多采用修改载体内容的方式嵌入秘密信息,因此很难抵抗各类隐写分析检测。为了解决上述问题,无载体信息隐藏技术应运而生。该技术强调不修改载体本身,而是从文
学位
近年来,在我国社会发展以及经济发展的推动下,科学技术水平有了很大程度的提高,PLC技术作为新兴科技在多个领域中得到了推广与应用,将其应用到电气工程及其自动化控制中对进一步提升工程效率以及提高自动化控制水平有重要的作用。基于此,文章以PLC技术在电气工程及其自动化控制中的应用为研究内容展开了深入的探讨,先分析了将该技术运用到电气工程及其自动化中的价值和优势,进而具体探讨了PLC技术的具体应用策略,以
期刊