基于汉字结构特征的数字水印溯源技术

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wangxiao8910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
涉密文件涉及国家利益、企业利益和个人利益,关乎国家安全、商业安全和公共安全,纸介质载体在涉密文件分发、使用和溯源过程中具有不可替代的作用,而使用数字水印技术是防止纸介质资料非法打印传播、追溯打印源的有效方法。基于数字水印的涉密文档溯源是当前信息安全领域研究的热点课题。但当前世界上的文本数字水印研究的字体多为英文,而汉字与英文在结构、笔画等方面都存在巨大差异,现有英文数字水印技术并不适用于中文文本,因而研究汉字的数字水印技术有着重要的现实意义。与此同时,应用于纸介质载体的数字水印技术必须要能抵抗打印、复印、拍照以及扫描等过程中产生的噪声干扰。为了有效利用汉字自身特征,设计出一种兼顾隐蔽性和抗干扰性的中文文本数字水印技术,本文做了以下创新工作:首先,研究了汉字自身的笔画结构,提出了一种基于汉字笔画交叉点特征的数字水印嵌入与提取算法,先将文字图片统一缩放为256*256尺寸,再为对汉字进行细线化处理,定位要做改动的笔画交叉处的特征点位置,然后从细线图上获取要做修改的轨迹点;进一步结合特征点和轨迹点对汉字笔画进行处理,从而改动汉字笔画间的交叉点数量;通过该算法可对2800多个常见汉字进行处理,以低于50个像素的改动操作来嵌入水印,不易被人察觉,且在经过打印、复印、拍照等操作后仍能保留完整的水印信息,具有良好的鲁棒性和抗干扰性。为了提高中文文本数字水印的提取准确率,将深度学习的连接文本提议网络(Connectionist Text Proposal Network,CTPN)字符检测模型和卷积递归神经网络(Convolutional Recurrent Neural Network,CRNN)字符识别模型引入到数字水印提取过程中。CTPN字符检测模型以卷积神经网络(Convolutional Neural Network,CNN)为基础,添加了长短时记忆网络(Long Short Memory Network,LSTM)层,可检测多个固定宽度的小文本段,再后处理将这些小的文本段连接得到文本行,在处理各类文本图片时可准确定位不定长文本行位置;CRNN字符识别模型能直接识别多种语言及字体的字符串,且能较好地识别形变字符,与使用传统的字符检测与识别方法相比,可明显提升数字水印的提取准确率。此外,基于上述所提中文文本数字水印嵌入与提取算法,给出了一种涉密文本溯源应用方法,该方法在视觉效果良好的前提下将用于文档溯源追踪的安全信息隐藏于纸质文档中,可抵抗打印、扫描、拍照过程中的各种不确定因素,有效追踪文件出处信息,具有很好的适应性和可靠性。
其他文献
随着用户隐私泄露和网络欺诈问题的出现,传统的检测机制已经不能阻挡愈演愈烈的攻击行为,需要新的技术手段辅助进行Web安全检测。作为沟通用户与网络数据的桥梁,浏览器广泛应用于用户与各种应用程序之间的交互,其中浏览器指纹包含着用户浏览器及设备等多种特征信息,其独特性可以极大地提高用户识别的准确率。但是浏览器指纹会随时间不断发生变动,基于静态指纹的研究方案难以满足动态指纹检测的要求。针对这一问题,本文研究
随着网络的迅猛发展,网络安全培训对校园安全至关重要。然而,传统教育方式集中培训难度大,培训形式不够灵活,以致于人力物力成本增加,培训效果不够理想。虽然在线网络教育这种新型教育方式正在普及,但是平台课程数量过多,用户很难从大量的课程中选择个人所需的课程。所以如何帮助用户选择合适的课程是课程培训系统中非常重要的一个功能。通过大量的调研,现有市场网络在线培训系统虽然都已实现了在线答题和系统组卷等功能,但
当前工厂内部网络呈现出工业协议种类多、协议间互不兼容的异构网络形态,导致工业设备之间信息难以互通。随着智能制造的发展,工厂内部网络呈现出IP化的发展趋势,因此,有必要在工业异构网络中研究统一的IP地址分配方式,以支持设备之间的无差别寻址通信。传统的DHCP方式不能根据设备在工业现场的位置信息为其分配固定的IP地址,不能满足工业场景需求。此外,地址分配过程涉及的子网和地址池等配置数据没有统一的数据建
新浪微博可以让任何拥有互联网连接设备的用户实时分享他们的想法,并实时发布他们可能目睹的事情。新浪微博的多样性激发了人们表达观点的热情,这使得新浪微博越来越多地被用作收集信息的工具。虽然带来了极大的便利,但在新浪微博上可以分享的内容几乎没有限制,它的开放性和及时性导致谣言信息的快速生成和传播,而且谣言信息的传播是毁灭性的。因此,新浪微博平台的开放性为如何利用自然语言处理和数据挖掘技术进行谣言检测提供
传统互联网架构设计存在安全性低、移动性支持差、可扩展性差等缺陷,无法满足天地一体化网络自主安全、可管可控、可靠稳定、泛在接入、按需传输等需求,需要创新网络体系结构和协议体系。标识网络从理论上解决了上述体系结构问题,但要将其应用于天地一体化网络中并满足上述需求,仍需进一步设计基于标识网络技术的协议体系。本文在此背景下设计和开发了天地一体化网络16位标识协议栈,该协议栈是通过标识网络技术自主构建天地一
文字是信息交流和文化传承的主要方式,其在人类社会中扮演着极其重要的角色。自然场景中的图像中通常包含了丰富的文字信息,准确而高效地提取这些文字信息有助于我们对图像及场景的理解。近年来,随着深度学习的发展,自然场景的文字检测和识别技术受到越来越多研究人员的关注。传统的自然场景文字提取技术通常分为两个独立的部分:文字检测分支和文字识别分支,这两个分支通常会被分别实现并执行,这种方式虽然看似简单,但也带来
随着互联网技术对众多领域的渗透,新型应用层出不穷,当前网络已无法满足消费者不断提升的低时延服务需求和无人驾驶、远程医疗等场景1~10ms的确定时延传输要求。提供确定性技术的方案分同步与异步两类,前者代表技术为时间感知整形器,与此相比,后者的异步流量整形器技术在时钟同步、带宽利用、对非周期时延敏感流的支持性等方面更有优势。在实际网络中使用异步流量整形器技术时,若不配以高效的调度机制,其适用场景将受限
互联网的高速发展推动着电子商务的蓬勃发展,各大电商企业为了让消费者充分享受电子商务的便捷之处,纷纷推出电商APP,但是浏览商品图片的购物方式已经不能充分地满足消费者的需求,并且APP下载安装流程复杂,这使得平台流失了不少用户。随着中老年用户的大面积触网,微信已经成为他们生活中不可或缺的一部分。该基于微信小程序的电商平台无需下载安装,操作便利快捷,微信强大的社交功能可以为平台获取大量的粘性用户。论文
图像目标检测技术是计算机视觉领域研究的基本问题之一,主要任务是在图像中对特定的目标物体进行定位和类别识别。现代目标检测技术大多基于深度学习方法,借助神经网络结构强大的图像特征学习能力,实现目标区域的类别预测和边框位置回归。然而该类方法仅利用视觉特征信息,而且独立地处理每个目标物体,缺乏对具体场景信息和目标之间内在关系的分析,因此整体检测精度受限,也难以适应复杂场景中多目标、多类别物体的准确识别需求
随着互联网的发展,数据呈爆炸式增长。网络中的数据有结构化数据、非结构化数据和半结构化数据之分,结构化数据一般以网络表格的形式呈现,相较于其他类型的数据,人们更容易从网络表格中发现感兴趣的信息。实体扩展是指,对于给定以实体列和属性名组成的查询表,将网络中的大量结构化表格作为数据源,对查询表所需要的属性值进行填充的技术。该技术在数据集成、信息检索等领域有广泛的应用。目前的实体扩展方法,主要通过模式匹配