软件漏洞源代码的语义标注技术研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:wuyu9603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着信息技术的发展,软件技术也得到了飞速的发展,软件的数量和规模都在不断的扩张。相应的软件中存在的漏洞也越来越多,据美国统计平均一千行到一千五百行代码中,人类编程人员就会在其中留下一个软件安全漏洞。与软件技术的飞速发展相反,软件漏洞的检测技术已处于瓶颈期,时至今日依然用传统的静态、动态或动静结合的检测方法。传统的漏洞检测技术已经跟不上软件技术的发展。伴随着软件数量的增多,被挖掘出来的软件漏洞数量也越来越多,目前世界上信息产业发达的国家都建有自己的漏洞数据库,某些企业和组织也建有自己单独的漏洞数据。这些漏洞数据库大多都遵循CVE标准相互兼容,如此以来就产生了很大的漏洞数据。那么如何合理利用现有的漏洞数据,为漏洞的检测提供新的方法越来越是我们需要面对的一个问题。结合当前的大数据技术,对漏洞数据进行分析挖掘是利用这些漏洞数据的方式之一。但是当前的漏洞数据以非结构化的方式存在于漏洞数据库中,不利于计算机的直接处理,因此本文对这些漏洞数据进行预处理使其能被计算机直接处理。为以后基于大数据技术的漏洞模式挖掘提供支撑。本文利用语义标注技术对漏洞数据进行预处理。语义标注技术在图像语义、语义Web等领域已经得到大量的研究,也得到了一定的研究成果,但是在漏洞源码领域尚未发现相关的研究。语义Web利用语义标注技术将非结构化的Web文档转化成结构化的RDF文档,结构化的文档方便计算机对其直接处理,在结合本体技术就能实现计算机对Web文档的理解功能。大数据处理技术也要求数据具有一定的结构。因此对漏洞源码的语义标注就是要将纯文本的源码文件转化成结构化的源码文件,在本文中我们将其转化为XML格式的文件。在进行标注时本文主要做了以下工作:(1)待标注实体的识别。对漏洞源码的标注首先要找到待标注的对象,本文对漏洞数据库中的漏洞源码信息进行了详细的研究,首先确定了待标注信息的组成,漏洞信息由两部分组成,一部分是漏洞描述信息,另一部是漏洞源码本身。确定了待标注的信息范围,接下来识别待标注信息中的待标注对象。其中最为关键的是对漏洞源码信息中实体的识别,本文以抽象语法树为依据对漏洞源码中的实体信息进行识别。(2)标签设计。对于所识别的每一个实体,依据实体类别设计相应的标签。本文对漏洞源码的编程语言进行详细的研究,对程序中的每一种元素进行归类表示,每一类元素制定相应的标签,并确定标签的子标签,属性等信息。(3)语义体现。在语义Web中语义信息主要由现有的本体体现,图像的语义标注中语义就是图像的类别。在本文中我们以标签的意义作为漏洞源码语义标注的语义体现。最后为了验证本标注方法的有效性,我们进行实验,在本文所提出的标注方法的基础上进行漏洞的模式挖掘,实验结果显示所挖掘出的漏洞模式与原漏洞模式一致,证明本标注方案具有一定的可行性。
其他文献
合同自由原则作为合同领域内的准则,是私法上一项重要原则。合同自由原则可以维护市场经济的有序进行,确保人们可以自由的进行经济活动。在合同领域,海上保险合同自始至终也要遵循此项原则,但同时也要对海上保险合同的自由进行适当限制,绝对的自由将导致利益的天秤偏向某一方,合同自由将失去意义,因此,要对合同自由进行适当的限制,以确保双方当事人处于平等地位。本文通过梳理《海商法》第十二章“海上保险合同”的规定和适
具有反馈环的GMDH(Group Method of Data Handling with a feedback loop简称为GMDH-FL)网络只有三层,结构简单;而模糊GMDH神经(Neurofuzzy GMDH简称为NF-GMDH)网络可以同时
肌球蛋白V作为最常见的线性分子马达之一,是将ATP水解过程中释放的化学能转化为机械功的纳米机器,参与细胞器和mRNA等的输运过程,其沿着肌动蛋白丝所作的定向和持续运动,是实
虹膜定位是虹膜识别中非常重要的一个环节。Daugman提出的圆周差分定位法鲁棒性和精确性较好,但当在整幅图像中搜索虹膜时,将非常的耗时,同时也会因为受到睫毛等的干扰而降低定位的精确性。本文在圆周差分方法的基础上,利用行、列的灰度信息和直方图来实现瞳孔的粗定位,然后采用一种新颖的快速迭代搜索方法来实现瞳孔和虹膜的精定位。采用此种粗定位与精定位相结合的方法极大的缩短了虹膜定位的时间,提高了定位的准确性
由于互连线电阻引起的时序问题对IC设计带来了越来越大的影响,选取精确的模型来计算延时变得非常重要.本文结合传统延时模型的特点,对有效电流源模型(ECSM)作了改进,通过分段
目的探讨使用SOX方案(替吉奥联合奥沙利铂)对进展期胃癌的临床疗效。方法回顾性分析2010年1月~2015年9月我院肿瘤科收治的59例进展期胃癌患者临床资料。所有患者均按SOX方案行2~4
落地四坡房屋属于典型的轻型低矮房屋,其本身质量轻,因而所受地震作用小,而风荷载、雪荷载往往是控制荷载。由于落地四坡房屋体形特殊,而国内外规范中都没有落地四坡屋面积雪
生物材料微纳形貌具有重要生物学功能,能够促进骨整合。对微纳形貌诱导骨髓间充质干细胞(BMSC)的分子机制研究,能够为新型生物材料的开发提供理论依据。通过文献调研发现,微纳形貌诱导BMSC分化过程中,物理因素相关的信号通路被启动,广泛参与调控BMSC成骨分化。机械应力是物理因素中的重要一员,它通过启动力学信号通路调控干细胞的分化、增殖、迁移等生命活动。但是,在微纳形貌诱导BMSC成骨分化过程中,机械