【摘 要】
:
编译器模糊测试是一种对编译器的稳定性与安全性进行测试的技术。有效的模糊测试需要具有正确的词法和语法的测试用例,只有这些格式良好的测试用例才能通过编译器的解析阶段,从而对目标编译器深层次的代码部分展开测试。深度学习技术因其捕获复杂特征的能力以及较少地依赖专家工程的特点,近来逐渐被应用到模糊测试用例生成领域,这些方法通过学习编程语言的语言模型,从而在无需提供复杂的编程语言语法规范的条件下生成格式良好的
论文部分内容阅读
编译器模糊测试是一种对编译器的稳定性与安全性进行测试的技术。有效的模糊测试需要具有正确的词法和语法的测试用例,只有这些格式良好的测试用例才能通过编译器的解析阶段,从而对目标编译器深层次的代码部分展开测试。深度学习技术因其捕获复杂特征的能力以及较少地依赖专家工程的特点,近来逐渐被应用到模糊测试用例生成领域,这些方法通过学习编程语言的语言模型,从而在无需提供复杂的编程语言语法规范的条件下生成格式良好的测试程序,节省了大量的时间与人力成本。然而,现有方法在捕获源代码长距离语法依赖上仍然面临一定的挑战,进而影响了模型生成有效测试程序的能力。因此,现有方法仍然会生成一定比例的语法错误的测试用例,这些测试用例无法通过编译器的解析阶段,从而无法对深层次的功能和特性展开有效测试。本文的主要研究工作如下:(1)针对现有方法生成测试程序解析通过率不足的问题,提出了基于注意力机制捕获源代码中的长距离语法依赖关系进而提升测试程序有效率的方法。基于该方法实现了原型工具DSmith,应用于开源编译器GCC的模糊测试后共发现了11处软件缺陷。(2)针对现有方法生成测试程序解析通过率不足的问题,提出了基于结构化语言模型的编译器模糊测试用例生成方法来利用源代码中丰富的结构化信息。基于该方法本文实现了原型工具TSmith,应用于开源编译器GCC的模糊测试后共发现了14处全新的软件缺陷。(3)针对现有方法基于循环神经网络及其变体实现,生成测试用例效率不够高的问题,提出了不依赖于循环神经网络的前馈结构的网络模型用于编译器模糊测试用例生成。基于该方法实现了原型工具Fincober,应用于开源编译器GCC与LLVM的模糊测试后共发现了13处全新的软件缺陷。本文针对编译器模糊测试用例生成中的一系列问题,研究了基于深度学习技术的测试用例生成技术,从实际问题出发解决困难与挑战,研究工作从生成模糊测试用例的有效性、生成测试用例的效率等方面展开。实验与评估部分证明了本文所提出方法的有效性。
其他文献
波长选择开关(Wavelength Selective Switch,WSS)是全光网可重构光分插复用节点中最关键的器件。基于自由空间光学结构的WSS目前存在着尺寸大、边缘端口插损大、端口之间串扰大等问题,本文就这些问题展开研究并进行优化设计,具体研究成果如下:1.针对WSS中由于光栅“圆锥衍射”导致的输出光斑水平偏移,推导了偏移量的近似计算公式。此偏移量会随着端口数的增加呈抛物线型递增,从而对边
对拦截机动目标而言,比例导引律存在理论上的缺陷,它不能保证视线的平稳。最优制导律虽在理论上可以实现零脱靶量,但这种制导律形式过于复杂,且需要精确已知弹目相对距离、相对速度以及目标加速度等信息。本文首先对一般的现实真比例导引律(RTPN)拦截机动目标的捕获区域进行理论分析;然后基于强化学习中两种典型算法深度Q学习(DQN)和深度确定性策略梯度(DDPG),提出两种只需视线角及视线角速率信息的强化学习
研究生教育无论是面向职业性,还是学术性,均以能力培养为目标。设计的生产、生活性特征,使其具有鲜明的现实性与实践性,设计行为和活动的目的旨在满足和美化人类的物质与精神需求,其研究生培养必须秉承理论与实践、科学与艺术、历史与现实、本土与国际四个有机结合。
2020年伊始,新冠疫情席卷全球,线上交流备受青睐,文本数据爆炸式增长。随着移动互联网的飞速发展和文本数据的海量积累,真实场景中的短文本分类需求变得愈加迫切。然而,在真实场景中,短文本分类同时面临标注数据不足、数据稀疏和不平衡分类三大挑战。现有研究又鲜有同时解决这三大挑战的有效方案。鉴于此,本文聚焦于短文本分类问题,主要完成了以下工作。在第一章,对短文本分类问题的研究背景、研究意义、相关研究现状,
众所周知,人工智能现在已经成为生活和科学研究中难以绕开的主题。目前,设计能够面对复杂环境并在环境中做出良好决策的智能体是现代人工智能研究的基础。在控制科学领域,对传统单一对象的控制方法和理论已经愈发成熟。同时,随着被控对象的数量的增加,多智能体系统逐渐成为在控制领域一个研究的热点。与传统的单一对象控制不同,对多智能体系统的控制往往需要考虑智能体所处的环境对整个智能体系统的影响。不幸的是,在实际应用
纺织产业是中国重要的支柱性产业,与民生大计息息相关。在以国内大循环为主要思路、国内与国际双循环互为促进的新型经济发展格局下,中国纺织业面临着先进制造技术新环境下可持续发展和高端发展的机遇和挑战,亟须实现产业的数字化、智能化转型升级。提升纺织产业整体的智能制造水平对实现中国“制造强国”的战略目标而言至关重要。然而,纺织企业在数字化转型的过程中,常因对企业原有发展路径的依赖以及数字基础设施不够完善,缺
党的二十大报告指出,全面建设社会主义现代化国家,最艰巨最繁重的任务依然在农村,农村问题是最基础、最复杂、最急需解决的重大历史与现实问题。随着社会治理创新的推进和乡村治理问题的不断显现,仅靠政府这一单一主体显然无法应对复杂的治理环境,这种现实需求生成了建设乡镇社工站的独特历史逻辑和现实逻辑。同时,我国广东、湖南等地乡镇社工站的试点探索彰显出乡镇社工站参与基层社会治理、改善民生服务的突出优势。福建省民
因为农业人口众多,耕地面积有限,我国农业一直以小农场为主的生产方式进行,但是随着人口老化的逐步加剧,同时伴随着城市化的推进,现在农业劳动力开始减少,未来中国粮食安全面临“谁来种地”和“如何种地”的挑战。解决这一问题的实现路径之一就是无人化农场技术。该文通过对上海市嘉定区无人化农场的技术实践,对无人化农场的概念、技术架构,以及基础设施、作业设备、数据监测系统和管控服务平台等关键技术进行系统阐述,对无
随着大数据时代的来临,深度学习技术的浪潮席卷了包括图像分类、语音识别、自动驾驶和内容推荐在内的多个应用领域。但是,数据量和神经网络模型复杂性的增加带来了巨量的计算开销,导致单机训练速度缓慢。基于参数服务器架构,在多个节点上分布式训练深度神经网络模型是一种行之有效的加速方法。由于神经网络模型训练的迭代性质,不同的计算节点之间需要频繁地进行通信以交换大量的数据,这就导致通信开销成为分布式训练中的关键瓶
随着当今信息化时代的高度发展,信号检测技术无疑已成为了科学领域关注的重要热点。特别是在复杂背景下的信号检测中,传统的信号检测方法开始出现局限性,检测性能不能满足实际需求,故探索信号检测的前沿技术在信号处理领域显得愈来愈重要。作为数据信息提取、凝练的有力工具,矩阵信息几何(Matrix Information Geometry,MIG)理论已经在信号检测领域被应用,并取得不少成果,但其高时间复杂度和