基于深度学习的跨平台二进制代码关联分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:awzh963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,越来越多的物联网厂商将第三方代码库编译并部署在不同平台上,由于代码的交叉复用,使得对跨平台的二进制代码进行同源性检测具有极大的实用价值。跨平台二进制代码同源性检测旨在检测来自不同平台的两个二进制函数是否属于同源函数。它有很多应用到安全方面的例子,比如抄袭检测、恶意软件检测、漏洞搜索等。现有的同平台二进制代码关联方法并不能直接应用到跨平台场景中来:比特流比对技术分析的对象是比特流,它与平台采用的编码方式相关;指令序列比对技术分析的对象是指令序列,它与平台采用的指令集相关;动态插桩技术分析的是动态分析过程中的中间结果,受限于分析工具的平台兼容性。现有的跨平台二进制代码关联分析依赖于近似图形匹配算法,这些算法在同源性检测速度上不可避免的比较缓慢,而且在精度上准确率不高,难以适应新任务。近年来深度学习技术已经广泛应用于各种领域,包括二进制函数分析,并且已经显示其精度高、速度快的优势。本文主要研究基于深度学习的方法检测二进制函数对的同源性,本文将利用二进制函数代码属性控制流图的跨平台性,为每一个待检测函数对中的函数提取出相应的属性控制流图,然后利用图嵌入神经网络为每一个属性控制流图生成一个嵌入向量,最后通过计算一对函数各自对应数值向量之间的距离来衡量待检测函数对的同源相似性。本文提出了基于全连接神经网络和基于GRU循环神经网络的两种图嵌入算法,在现有的属性控制流图顶点嵌入算法的基础上,分别利用全连接神经网络和GRU循环神经网络来生成图嵌入,最终对整个孪生图嵌入神经网络进行端到端地训练。实验结果表明:在使用同样的训练和验证数据集的情况下,本文提出的两种图嵌入算法表现出的相似性检测准确性方面优于现有基于深度学习的关联技术,并且两种算法在对非同源的二进制代码对检测方面的效果更加显著。
其他文献
随着互联网技术的不断发展,传统网络出现了 IP地址匮乏,路由扩展性差等一系列不可调和的问题。为了解决这些问题,SDN(Software Defined Network)技术应运而生。而为了使传统
本文应用文本研究方法扼要分析了徐光启对利玛窦传教方法的影响。提出徐光启帮助利玛窦认识儒士对天主教的疑问和困惑;为利玛窦的著作写跋,赞美利玛窦及其所传之学、所信之教
会议
图论知识在电路的设计和计算机操作系统中预防出现死循环等一系列实际问题中的应用引发了对通过去掉图中的一些点(当然也去掉了与这些点相连的边),从而破掉图中所有圈的问题
本文主要以BJ市XNH购物中心为对象,按照商业计划书的要求,全面详细的分析了项目的各方面状况。本商业计划书的目的在于为XNH购物中心项目进行全面分析、向潜在投资人提供项目
荧光探针是检测离子最有效的检测方法。荧光探针具有热稳定性和光稳定性,具有较大的斯托克位移,且具有无毒性和较好的穿透细胞膜的能力。鉴于此,本论文通过设计和修饰苯并噻
以复杂性、系统性、综合性为特征的现代工程,对工程科技人才提出了更高的要求。为了满足工程实践的需要,工科学生工程领导力培养被提上日程。究竟工科学生的工程领导力是什么
石墨烯是一种具有二维共轭结构、大的比表面积、高的电子迁移率及化学稳定性的新型碳纳米材料,它一经发现就被应用到了储能、光催化、电子及化学传感器等领域的研究上。然而,
无人艇集群编队是由多个无人艇组成的系统,系统中的无人艇进行信息交流,相互协调完成指定的任务,有着长时间作业,低成本,效率高,冗余性好的优点,可以完成海上巡逻,搜救,监视等任务,在民用和军用都有极高的使用价值。为此,本文研究了基于蜂拥算法的无人艇集群编队问题,具体内容如下:1.考虑到基于质点模型的蜂拥算法直接应用到欠驱动无人艇模型的困难性,提出一种基于目标跟踪的蜂拥算法转化策略,并基于反步滑模法设计
孪晶是金属材料中一种重要的强化方式,对于面心立方金属材料而言,高比例的孪晶不仅可以提高材料的强度,还可以提高材料的晶间腐蚀抵抗力、对疲劳和蠕变的抗力以及提高材料的延展性等。但是,在层错能较高的Al及Al合金中,孪晶极少出现,因而很难被利用来提高Al合金的强度。然而,近期对超高纯铝材料的研究发现,在退火过程中,有高比例的退火孪晶出现。因此,研究清楚超高纯铝中高比例退火孪晶的形成条件、形成机理和热稳定
在海洋获取的信息中,清晰的水下图像扮演着举足轻重的角色。但由于水下介质和大量悬浮颗粒,使得光线在水中产生了吸收和散射。因此,原始水下图像出现了严重降质,例如颜色失真