基于深度学习的多样性长文本隐写方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:Adisc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息网络的飞快发展,人们每天通过网络传输着海量的隐私数据,数据传输的安全等问题也随之产生。信息隐藏技术通过隐藏隐私数据的存在,实现隐私数据传输的安全性保护。而文本作为日常生活中信息传输的载体,使用深度学习语言模型,实现文本隐写,对信息隐藏领域的发展具有重大的推动作用。然而现有的文本隐写方法生成的短隐写文本隐藏容量较小、多样性较差、使用场景有限。为了解决文本隐写所存在的问题,本文从多组主题约束和单组主题约束两个方面,对多样性长文本隐写方法展开研究,研究内容主要包括以下两点:1.多组主题约束。考虑到隐写文本隐藏容量较低、使用场景受限,本文设计了一种细粒度从句主题约束的多样性长文本隐写模型。首先,使用双向门控循环单元(Bi-directional Gated Recurrent Unit,BiGRU)和注意力机制提取长文本和层级从句语义特征,综合考虑从句-从句、单词-单词之间的语义关系,提升长隐写文本上下文语义相关性。其次,引入变分自动编码器(Variational Auto-Encoder,VAE),完成主题特征对从句生成的细粒度约束,提升隐写文本多样性,丰富隐写文本使用场景。最后,提出左子树隐写嵌入方法,减小因嵌入容量而对文本质量产生的影响。实验表明,模型具有细粒度的主题表达能力,能够隐藏更多的隐私数据,并且生成的隐写文本和真实文本具有较好的不可区分性。2.单组主题约束。针对多组主题关键词约束下的模型通用性以及单组关键词特征覆盖等问题,本文设计了一种全覆盖主题特征分布的多样性长文本隐写模型。首先,对输入的全局主题关键词进行扩充和分组,并使用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型完成主题关键词和从句的相似性匹配。其次,使用Transformer对主题和长文本的关系表示进行特征编码,增强长文本的主题表达能力。最后,引入门控循环单元(Gated Recurrent Unit,GRU)和GPT-2预训练模型分别完成从句级别和单词级别的解码,并结合左子树隐写嵌入方法自动生成主题特征全覆盖的隐写文本。实验表明,模型具有单组主题特征合理有效分配的能力,并且生成的隐写文本具有较强的信息隐藏能力。
其他文献
随着社会的进步与生活水平的提高,广大医务工作者更加关注生命终末期患者的生活质量,同时,患者及其家属对此需求也越发强烈。随着对“善终”的向往,“安宁疗护”逐步受到业界重视,其宗旨是提高患者生命终末期质量,并充分尊重其价值,最大限度地减轻患者的痛苦及节省有限的卫生资源。本文就我国安宁疗护发展现状及面临的问题作一综述。
期刊
人脸活体检测是生物认证防伪领域内的重要研究课题,在日常生活中有着广泛的应用。目前,研究者们为了更有效地对真实人脸与伪造人脸进行分类,在不同的方向进行了研究。早期伪造人脸的质量与类型存在一定的缺陷,人脸活体检测方法主要通过纹理与图像质量等特征对其进行区分;随着伪造人脸的类型逐渐丰富,制作逐渐精细,目前主要利用深度学习、辅助信息等方法对其进行区分。然而,现有方法在面对单个数据集或单一维度的伪造人脸攻击
学位
时间序列是将某种统计指标的数值,按时间先后顺序排列所形成的序列。时间序列存在于众多领域之中,对其进行数据挖掘分析也是当今的研究热点之一。在对数据进行聚类,分类和回归等常见的时间序列数据挖掘任务之前,通常都会计算时间序列之间的相似度,计算结果在后续挖掘分析中起到了很大的作用,但时间序列相似性度量方法的设计与具体的应用密切相关。动态时间弯曲算法DTW(Dynamic Time Warping)是时间序
学位
主要回顾正念自我照护和专业生活品质的概念、测量工具和理论机制,介绍安宁疗护从业人员正念自我照护与专业生活品质的研究现状及相关干预方案,在此基础上,对正念自我照护在专业生活品质的研究方向提出展望,以期提高安宁疗护从业人员专业生活品质,为引导其用积极、有效的应对方式面对同情疲劳提供参考。
期刊
联盟链,是由多个组织共同管理维护的去中心化的分布式账本。由于记录在链表上的数据具有透明性和不可篡改性等性质,工作节点能够快速验证交易的合法性,同时用户的身份信息和交易细节也被暴露给参与者。环签名作为一种特殊的数字签名,它将签名者的私钥隐藏在公钥列表中,实现匿名签名的效果,适用于对隐私需求较高的多方协作场景。因此,本文基于环签名对联盟链当前存在的用户身份隐私和可监管问题展开相关研究,主要研究工作如下
学位
随着卫星遥感系统的快速发展,遥感图像在灾害预警、森林植被监测、军事探测等方面得到了广泛应用。然而,由于技术的限制,单个传感器无法同时获得具有高分辨率光谱域和空间域的遥感图像。因此,在实际应用中,需将光谱分量和空间分量进行组合处理,通过全色锐化获得高空间分辨率的多光谱图像。近年来深度学习已经被广泛应用于全色锐化任务,并取得了显著的成果。但大多数方法无法有效地寻求图像间的映射关系,亦或缺乏针对整体网络
学位
随着城市信息化进程的加快,路网中传感器逐年增多,交通数据呈现爆炸式增长。但由于建设成本的限制和建设时间的不同,路网中的传感器质量参差不齐,在数据的采集、传输和存储的过程中不可避免的存在数据丢失的问题。高质量的交通数据是智能交通系统(Intelligent Transportation System,ITS)构建的基础,数据的缺失为后续的工作带来极大的挑战,是当今智能交通系统构建及智慧城市发展亟需解
学位
区块链技术因为具有去中心化、安全可靠的特点正在被广泛应用于社会生活的各个领域中。共识算法作为确保区块链系统中各个节点行为达成一致的底层关键技术,其性能直接影响着区块链系统的运行效率。当共识网络中的节点数目增加时,各个节点间的通信量也会增加导致系统的效率降低。为了提升联盟区块链系统的运行效率,本文研究了实用拜占庭容错算法的运行机制并进行了改进,主要研究内容和创新如下:1.针对现有的共识算法没有考虑到
学位
在市场经济下,工业生产企业自负盈亏,各单位管理人员将利润提升问题作为管理工作重心。因此会计工作,就从最单纯的记账、会计核算,提高到为生产企业管理人员提供令人信服的决策数据,该过程涉及了企业的成本管理和产品销售价格。本量利分析方法是企业经营管理会计工作的一个基本方式,一般运用在企业生产经营管理工作决策中。文章以非标机械制造企业为例,首先介绍了本量利分析方法的定义以及包括的重要工作内容,并剖析了它在企
期刊
个性化新闻推荐是网络新闻服务的一项重要任务。随着深度学习的发展,以端到端的方式直接从原始数据中学习关于新闻内容和用户兴趣的向量表示逐步成为研究热点。得益于各种有效的表示学习方法,基于神经网络的新闻推荐模型层见叠出,成绩非常出色。然而当焦点集中在如何构造或应用更加先进的神经网络模型时,许多研究忽略了对新闻内容信息的充分探索。经调查,现有方法在学习新闻表示时没有对正文文本进行有效利用,并且在利用主题信
学位