基于MGGP演化的软件缺陷预测技术研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:hang_925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷预测是指通过挖掘软件历史缺陷数据特征,分析软件模块中缺陷数量与特征对应关系构建预测模型,然后利用预测模型预测出新的软件模块中可能存在的缺陷。目前大多数缺陷预测模型的目标是预测给定软件模块中的缺陷数量。然而由于软件模块特征中存在噪声数据,构建出来的模型很难精确地预测模块中的缺陷数量。研究人员进一步提出通过预测相对缺陷数量对软件模块进行排序,进而指导测试人员将有限的资源优先分配给缺陷数量较多的模块。但由于软件模块特征维数过高,以及特征之间的相关性导致存在一些冗余特征,需要在构建缺陷预测模型之前进行特征选择或特征降维,这个过程可能导致一些对缺陷预测有用的特征被筛除,从而导致预测模型的性能下降。本课题分析了软件缺陷预测中每个模块特征值与对应缺陷数量之间的关系。首先依据直接优化预测模型性能指标的思想研究基于遗传算法的非线性预测模型构建优化,然后进一步采用多基因遗传编程(Multi-Gene Genetic Programming,MGGP)算法,通过MGGP在处理多重共线性问题方面的优势构建缺陷排序模型,对软件模块中缺陷数量的相对高低进行排序。具体来说,在构建软件缺陷排序模型的过程中,将软件模块的特征值作为自变量,将模块对应的缺陷数量作为因变量,利用多基因遗传编程的思想,演化出缺陷数量与特征的关系表达式,进而利用构建的模型对新的软件模块进行预测。为验证构建的软件缺陷排序模型的预测能力,本课题在11个公开缺陷数据集上进行了实验,比较分析了使用全部特征和去除冗余后部分特征的情况下,评估多基因遗传编程方法构建的预测模型、基于遗传算法的非线性预测模型以及原始非线性预测模型对软件模块中缺陷的预测能力。实验采用了平均缺陷百分比(Fault-Percentile-Average,FPA)来评估预测模型的性能。结果表明,采用MGGP构建的软件缺陷预测模型在缺陷模块排序方面明显优于现有的非线性预测模型,基于遗传算法构建的非线性预测模型优于原始非线性预测模型。另外采用MGGP方法构建的软件缺陷排序模型可以不考虑软件模块中冗余特征的影响,直接利用原始特征就能构建出效果比较好的预测模型。
其他文献
目标跟踪是计算机视觉领域的一个非常重要的突破,也是许多研究学者现在的主要研究方向。目前,目标跟踪已经在智能监控、智能交通、人机交互、医学图像等方面得到广泛应用。目
随着云计算技术的迅速发展,应用系统日益复杂,单一的简单服务已经不能满足许多现实情况下的功能需求,服务组合成为一种有效的解决方式,通过动态地组合具有不同质量属性的原子
自2015年7月北京携手张家口申办冬奥会成功以来,我国滑雪旅游产业链逐步升级,市场需求不断扩大,滑雪旅游产业发展进入黄金时期。黑龙江省凭借优越的滑雪资源与悠久的滑雪历史成为了我国滑雪旅游胜地之一。但随着国家大力发展冰雪旅游的号召,全国各地开始进军滑雪旅游产业,黑龙江省“一支独秀”的局面已被打破,所占滑雪市场份额已出现大幅度下滑。面对日益激烈的竞争,黑龙江省必须打破产业壁垒,加快整合区域资源,提升滑
学位
食品安全越来越受到人们的关注,特别是农业生产中必不可少的农药带来的安全问题。有机磷农药是现今农药生产量和使用量最大的农药,因蔬菜具有时效性,往往喷洒过有机磷农药的
网络虚拟化在底层物理网络设施上逻辑抽象出多个虚拟网络,提供给多个租户使用。软件定义网络(Software Defined Network,SDN)集中控制的思想为网络虚拟化的实现提供了更加简
传统传感器的SLAM一般需要在环境放置识别标志,基于视觉的SLAM系统可以在不改变环境的情况下实现定位与建图需求,并且更加灵活多变,适应复杂环境。但是基于视觉的SLAM系统在
在服务质量(QoS)感知的Web服务组合研究中,衡量服务质量的标准通常是用户的非功能属性。然而,传统的Web服务组合方法难以恰当地处理用户非功能属性的不确定性与多目标性,也并
旋转浮阀(rotary valve)塔板具体低雾沫夹带、低漏液、高操作弹性的特点,但其板上气含率分布还未得到研究,本实验在直径为600mm的有机玻璃塔内,以空气和水为物系,对旋转浮阀
现如今,石油套管等无缝钢管的需求不断增加,尤其是高钢级的无缝钢管的需求极其强烈。这些钢管都需要通过热处理进行钢级的提高才能使用。由于国家大力地推行绿色制造技术,以
交通是衡量一个城市发展的重要指标之一,随着大气污染越来越严重,低碳交通成为人们关注的焦点。然而近几年来人们盲目追求经济增长,尤其在县域城镇方面很大程度上忽略了可持