Word和PDF文档的恶意性检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:taohua3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的飞速发展,越来越多的人开始注重保护个人隐私及重要数据。各种恶意性文档的出现给人们工作和生活带来了巨大危害,其中,Microsoft Word和PDF等比较大众化的文档编辑和查看软件成为了攻击者的目标,各种恶意性攻击层出不穷,漏洞数量急剧上升,给人们造成了不可挽回的损失。若能针对可疑的Word和PDF文档,设计出快速有效的检测算法,这将在某种程度上大大遏制恶意性文档的危害。针对上述问题,在研究Word和PDF文档安全性背景的基础上,分析了Word和PDF文档常见的攻击方式,阐述了目前的检测研究现状。已知的恶意程序检测系统中,动态检测的缺点是检测时间过长,静态检测的缺点是准确度不高。机器学习算法拥有对数据进行分析和建模的能力,可以挖掘蕴藏的统计规律,越来越多的安全领域研究者尝试使用它进行恶意程序检测。本文在已有研究方法的基础上,提出两种基于机器学习的快速有效的检测算法:1)基于API行为特征和Inception V3模型的Word和PDF恶意性动态检测沙箱技术是当前最常用的动态分析技术,但它是以时间开销和虚拟化指令系统为代价的。在改进的Cuckoo沙箱系统基础上,设计了一种基于深度学习模型GoogLeNet Inception V3的Word和PDF文档的恶意性动态检测算法。对改进的Cuckoo沙箱系统的文档运行结果根据API依赖关系进行抽象,得到文档的特征向量,再进行维度转换,以二维特征作为算法的输入。Inception V3网络会提取每幅二维图像的Bottleneck特征,接着采用迁移学习的方法训练分类器,最后实现文档的恶意性动态检测。实验证明,该算法在对未知Word和PDF文档的恶意性检测上取得了较好的时间性能,而且检测率达到了89.1%。2)基于K-means和深度文本特征检测网络的PDF恶意性静态检测传统的PDF文档静态检测一般是针对于某种特定的攻击方式,而且检测率较低。针对这些问题,设计了一种PDF文档的恶意性静态检测算法,它包括两个方面:基于K-means的区别性文本特征的提取和基于深度文本特征检测网络的算法分类。通过PDF解析工具PDFMiner和K-means聚类算法提取到恶意和正常PDF的区别性文本特征,作为算法的输入;深度文本特征检测网络是一种设计的15层的深度线性神经网络结构。实验证明,该算法对未知PDF文档的恶意性检测率达到了86.6%,而且可以有效处理不同攻击方式下的恶意性PDF文档的检测问题。
其他文献
[目的]为了查明新疆某规模化牧场犊牛发病死亡的原因,[方法]试验采用现场流行病学调查结合实验室检测方法进行研究。[结果]结果表明,该病的发病率为39.43%,病死率为32.14%,易
程序设计思维能力是计算机及相关专业学生最重要的专业能力之一,程序设计课程教学的重要任务之一是培养学生的程序设计思维能力。本文分析了高级语言程序设计课程的现状,提出
<正> 今年(指一九八○年——译注)9月12日正好是拉斯科岩洞壁画被发现四十周年。被称之为“史前时代的西思代纳礼拜堂”的这座优秀的壁画,与到去年已是被发现一百周年的西班
.NET从诞生至今已经发布了6个版本,其版本的演进对C#课程教学造成一定的影响。文章概述.NET框架的版本演进过程,分析由于.NET版本升级给教学带来的问题,给出具体的对策;针对
供应链的一个重要领域是逆向物流,有效的供应链和物流管理需重点关注。逆向物流产生和增长的原因主要有客户退货、环境挑战和经济价值,良好的逆向物流管理可以降低成本、改善
现代英语多用“形合法”,在很多情况下,语篇的连贯性要通过形合连接来实现。所以,对语篇形成手段的理解直接关系到语言技能的发展,而理解形合对篇章连贯的辅助作用更是提高阅读和
实训教学的目标在于让学生将理论知识应用于实践,从而真正掌握所学知识。文章通过研究信息系统课程的实训教学环节,从实训教学内容设置、实训教学体系构建等方面探讨适合信息
介绍作者在数据库技术课程的教材编写和教学过程中使用的一些具体方法和措施,提出以案例、任务、项目驱动模式编写教材,使用教、学、做一体化教学方法组织教学,让学生熟练掌握数