恶意PDF文档检测技术研究与实现

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:joyce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,以信息交换和数据分发为目的的电子文档传播日趋频繁,便携式文档格式(Portable Document Format,PDF)已成为了全球电子文档传播格式的事实标准。但同时由于PDF文档易传播、易扩展等特点,PDF文档也成为网络攻击者实施恶意攻击的重要载体,越来越多的研究学者开始关注于PDF文档的安全问题。但是由于恶意PDF文档的恶意特征复杂化及攻击手段多样化等特点,现阶段的恶意PDF文档检测方法都存在一定的不足之处。如何提高对当前恶意PDF文档的检测准确性,并适应未来不断出现的恶意PDF文档,是当前恶意PDF文档检测技术研究的重点。本文研究了当前恶意PDF文档检测的研究背景、意义及发展现状,在目前绝大部分恶意PDF文档都是基于JavaScript代码的这一事实基础上,提出并实现了一个恶意PDF文档检测系统。在恶意PDF文档的特征生成与特征提取的研究中,首先提出了一种充分提取PDF文档中内嵌JavaScript代码的方案,并针对现阶段几种常见的代码混淆手段采取了相应的代码反混淆处理,可以有效地还原代码原始信息并提高对恶意PDF文档检测的准确率。其次针对恶意PDF文档特征的特点,本文基于TF-IDF算法进行特征生成,并对生成的特征进行分析。同时基于PCA算法进行特征提取,最终获得理想的恶意PDF文档多维特征向量。在恶意PDF文档检测模型的研究中,首先提出了一种改进的OCSVM算法分类器,通过对特定的恶意PDF文档特征设立子模型,有效地提高了对该类恶意PDF文档的检测准确率。其次针对传统检测模型无法有效利用大量未知PDF文档进行学习和训练的问题,本文基于Tri-training半监督学习算法建立了静态检测模型,提高了检测系统的检测能力及泛化能力。最后本文针对静态检测模型无法检测0day型恶意PDF文档的问题,提出了一种基于libemu的动态检测方法作为对静态检测模型的补充。实验结果表明,与传统的恶意PDF文档检测技术相比,本文提出的检测系统在对恶意PDF文档检测结果上拥有更为准确的检测率,验证了本文研究方案的可行性。
其他文献
采用雅鲁河流域碾子山水文站等10个水文站雨量站67 a历时水文资料,利用水文统计分析方法,对雅鲁河流域径流、泥沙、降水、蒸发水文特征的变化分布规律进行了分析论证.为合理
<正> 秧歌是我国北方流行甚广的一种民间舞蹈形式,如东北大秧歌、陕北秧歌、山东秧歌等均各具特色。说起老北京人,原本对舞蹈设有多大天份。因人们从小受的教育是“站有站相,
利用2004-2011年面板数据和系统GMM估计法对产业集聚与产业成长关系的研究表明:一般技术产业集聚同产业成长呈"倒U"型关系,部分省市已呈现出过度集聚状态;高技术产业集聚同产
建筑工程造价指的是在建设某一项目工程时,所需要的全部费用,具体而言,建筑工程造价包括安装工程费用、设备购置费用、工程建设费用等等。本文首先介绍了建筑工程造价的概念,
结合我国众包现状,基于技术接受与使用整合模型(UTAUT模型),提出了改进的研究模型。通过问卷调查收集实证数据,进行信度和效度检验;采用结构方程模型(SEM)分析网络社区众包创
<正>2011年9月6日,我国国务院新闻办公室发表《中国的和平发展》白皮书,详细阐释了中国选择发展道路的方向以及中国的发展对世界的意义。通过这份白皮书,首次明确界定了国家
当今社会,互联网与我们的生活和工作关系越发密切,PDF文档的应用范围也不断扩大,它已经成为我们电脑中文档存储和网络传输过程中的重要格式。随着PDF的广泛使用,攻击者利用PD
近40年来,电视剧的音乐与剧集在水乳交融中已形成良性互动,构建了深度的互文性传播,歌曲传唱不衰,剧集影响深远。随着媒介技术和社会文化的变迁,电视剧音乐的传播主体、客体
钼铼合金具有优良的塑性、焊接、抗辐射等性能,在航天、核能等高科技领域有广泛的应用。详细介绍了钼铼合金的粉末冶金方法制备工艺、不同铼含量的钼铼合全性能及其它元素对钼