基于本体语义的自然语言水印技术研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户：sh_duoduo

【摘要】

：

随着互联网的飞速发展,多媒体数字文本在传播过程中导致的版权纠纷正日益成为一个亟待解决的难题,为了能够有效地保护作者版权,文本数字水印技术应运而生。传统的文本数字水

【作者】

：

陆鹏

【机构】

：

华东师范大学

【出处】

：

华东师范大学

【发表日期】

：

2009年期

【关键词】

：

自然语言文本水印 TMR 本体语义 L语义水印 L水印阈值

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的飞速发展,多媒体数字文本在传播过程中导致的版权纠纷正日益成为一个亟待解决的难题,为了能够有效地保护作者版权,文本数字水印技术应运而生。传统的文本数字水印大多基于格式上的修改,使得文本修改前后的变化无法被人们轻易察觉,以达到嵌入水印的目的。例如,通过改变文本字间距、行间距、空格符、字符颜色、字符尺寸等嵌入水印信息。这类方法虽然取得了一些效果,但其最大的缺点是水印鲁棒性很差,攻击者可以通过“copy to notepad”的方法轻易去除这些水印。为了弥补这类鲁棒性缺陷,学术界提出了通过同义词替换并使用英文单词的ASCⅡ码来嵌入水印的方式,典型代表是Equmark系统。这类方法虽然使得水印更为隐蔽,但无法阻止攻击者通过随机替换来破坏原有的水印信息。接着,研究者们开始着手在更高级别的语法要素上开展数字水印研究工作,典型代表就是Atallah等人于2000年提出的基于语法结构转换的水印嵌入方案,该方案通过转换句子的语法树,使得水印承载句的某几位正好匹配待嵌入的水印信息,以达到嵌入水印的目的。语法水印技术大大拓展了水印容量空间,便于实现,相继出现了若干个演示系统,如Enigmark等。近些年,自然语言水印技术的前沿热点逐渐转向了语义水印领域。语义水印通过引入本体语义TMR树来表示句子的语义结构,使得转换后的TMR树二进制串的某些位正好匹配待嵌入的水印。相比语法水印,语义水印转换形式多样,具有更好的灵活性,同时也具备更好的水印容量空间。基于上述背景,本文围绕这个主题开展的工作如下:重点围绕目前的语义水印技术在某些方面的不足提出了3个创新点。一、提出了L语义水印方案。该方案主要针对Atallah语义水印在遭受语序调整攻击时,无法取得令人满意的效果,提出了一个改进方法。本文引入TMR串重排序预处理机制进行优化,使得改进后的方案可以在一定程度上抵抗语序调整攻击。二、提出了L语义水印阈值概念,在这个阈值下进行的L语义水印实验可以获得最高的水印检测率。三、提出基于L语义水印阈值的水印修补策略。水印在遭到轻微破坏的情况下并非完全失效,本文提出了一种水印修补方案,利用最长公共序列的思想,提供了在水印遭到破坏时的一种检测策略。最后,实现了一个原型系统。该原型使用MIKROKOSMOS项目提供的9个TMR样本测试L语义水印方案的有效性,同时通过在三个不同水印阈值设定下的重复比对试验,验证L语义水印算法的最佳阈值。实验表明,L语义水印方案在阈值设定为20bit时具有最好的抗语序调整攻击特性,本文提出的L语义水印方案具备较好的鲁棒性和可靠性。

其他文献

图像分类和图像语义标注的研究

随着多媒体技术的发展和Internet的普及,人们获得各种多媒体信息越来越容易,其中图像是数量最多的一种,如何有效地、快速地从大规模图像数据库中检索出所需要的图像已成为人

学位

基于内容的图像检索图像分类图像语义图像标注纹理分类支持向量机MPEG-7

中文分词及其在基于Lucene的全文检索中的应用

随着网络的发展及普及，电子文档正以惊人的速度增长。如何从这些海量信息中快速、准确地提取有价值的信息已经成为人们关注的焦点，这给信息检索技术带来了机遇和挑战，同时也促进

学位

全文检索Lucene中文分词分词算法哈希

基于句子的网页鉴别与实体关系抽取问题研究

网页是传递信息的重要载体，以网页作为研究对象是现今信息检索与信息抽取研究的必然趋势。鉴于句子既是传递信息的基本单位，又是表达完整意思的语言单位，本文以句子为出发点对网

学位

信息处理网页鉴别实体关系抽取句子

Web服务关联语义索引的构建理论与实现方法的研究

Internet为商业服务提供了开放、通用、标准的信息基础设施,并由此形成了新的商业模式,例如E-services,E-commerce,B2B,B2C,C2C,Virtual Organizations等。有效发现和整合已

学位

Web服务关联语义索引数据挖掘运行模式

基于IEEE 802.15.4 mesh路由协议的研究

作为当今热门研究领域之一的无线传感器网络技术,由于其日益成熟的技术和广阔的应用市场,越来越受到诸多关注。IEEE 802.15.4是一个低数据率的WPAN(LR-WPAN)标准,具有复杂度

学位

IEEE 802.15.4AODVLOADLOW-AODVNS-2

融合多模式信息特定音频检索技术研究

随着数字媒体技术的发展,越来越多的人能够更加方便地接触到数字媒体。多媒体检索的目的是从大量的多媒体资源中自动地查找与用户查询请求相关的各种多媒体信息。电视媒体是

学位

多模式特定音频音频指纹音频检索

针对模板生成网页的数据自动抽取方法的探讨与应用

随着Internet的迅速发展,互联网已成为一个巨大的信息库,为了有效地利用互联网上的信息,各种Web信息抽取技术应运而生。目前,Web上的很多网页是网站根据用户请求从后台数据库

学位

Web信息抽取技术网页模板标签树匹配算法Ctokens

基于Lucene搜索引擎库的本体映射方法的研究与实现

随着语义网络的迅速成长,涌现和积聚了很多语义信息。然而,因为语义网络分布的自然性,语义网络上的数据不可避免地来自于不同的本体。本体之间的信息加工处理不可能脱离了它

学位

Lucene搜索引擎库本体映射Lucene本体匹配器I-Sub算法

服务质量敏感的网格服务工作流调度算法研究及系统实现

网格服务是一种基于WSDL定义的Web服务,而且满足一系列面向客户端交互的相关接口定义和行为标准。随着网格服务及应用的复杂性不断提高,需要为其引入工作流,可以通过工作流将

学位

网格服务网格工作流服务质量自定义BPEL

基于JMS与Web Service的分布式异构数据库同步的研究

在深入研究现有数据库同步模型的基础上,为了提高系统的跨平台能力,便于中小企业信息化平台建设,本文提出了一种基于JMS与Web Service构数据库同步的架构方案。利用JMS实现了

学位

JMS分布式同步Web Service异构数据库缓存

基于本体语义的自然语言水印技术研究

其他学术论文