基于聚类和投票的缺陷模块序列预测

来源 :南京大学 | 被引量 : 0次 | 上传用户:czwhczwh75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷的存在给软件的安全使用带来了巨大的隐患。软件缺陷模块序列预测能够帮助软件从业人员对软件中的缺陷进行审查和检测,成为软件质量控制的有效手段。目前已有的软件缺陷预测研究,在实际应用时存在一定的问题。其中,基于有监督学习的缺陷预测模型在建模过程需要软件的历史缺陷信息,不适用新开发的软件;基于无监督的缺陷预测模型在预测时只提供有缺陷类和无缺陷类,没有对软件模块按照缺陷倾向进行排序,不利于测试资源的有效分配;基于半监督的缺陷预测模型在建模过程需要有专业人员参与,因此在实际应用时代价较大。特别地,现有的缺陷预测模型大多采用基于混淆矩阵的评价指标,没有考虑审查/测试潜在缺陷模块所需的工作量,因而不能保证应用这些模型时的收益。本文首先在基于聚类的缺陷预测模型上设计了四种排序算法,通过采用工作量感知的指标,在五个开源数据集上比较了这些排序算法的性能;然后设计了一种基于投票的缺陷序列预测模型,对建模过程中的投票者和投票策略的选择给出了建议,实验表明在同样的工作量下,该模型具有比代码行升序模型更好的预测性能,从而具有实用价值;最后结合基于聚类的缺陷序列预测模型,利用投票的方法对类簇内部的模块缺陷排序进行了研究,发现利用投票方法能在类簇内部给出比代码行升序模型成本效益更高的模块缺陷排序。本文主要有三个贡献:(1)在基于聚类的缺陷模块排序模型上,提出了四种簇间/簇内排序算法,并对四种算法的缺陷模块排序能力进行了比较;(2)提出了一种基于投票的缺陷模块排序模型,利用常用的度量信息对软件模块的缺陷倾向进行投票排序;(3)提出一种结合聚类的缺陷模块投票排序模型,对多种投票方法在类簇内部的缺陷模块排序能力进行了分析。
其他文献
该学位论文首先介绍了局域网和以太网的基本理论,以及以太网的高速发展充分奠定了它在局域网中的技术优势.接着介绍了中国课题组自行设计的信息化小区以太网交换机的总体设计
该文首先论述p-HPF多范式并行编程方法,包括p-HPF与F77+MPI的混合编程、支持混合编程的内部函数、p-HPF与不同运行方式的串行程序以及并行算法库的混合编程等,给出了若干编程
该文描述了一个基于XML数据库的,可作为数字资产管理子系统的图片内容管理系统的设计和实现.数字资产管理是企业存储、检索和发布数字资产的过程.数字资产通常含义上是指包括
随着网络规模的扩大和用户数量的急剧增加,使得互联网的流量急剧增加,给网络的带宽造成极大的压力,也加大了服务器的负担,导致服务不稳定。当前C/S架构网络将信息的传输中转
该文第二、三章简单介绍了软件度量研究及一些经验试题模型.该文第四章利用《广东省公安厅消防局计算机办公辅助系统》项目所采用的详细设计规范研究数据库系统复杂度;并探讨
该文针对焊接过程动态位移场的ESPI测量,研究了散斑干涉条纹图像的有效处理方法.该文描述基于双光束法的面内位移测量系统的数学模型,并给出了采集焊接过程中包含试件变形信
该论文主要研究生命周期工作流的相关理论与技术,包括生命周期工作流的表示与驱动、系统实现的体系结构和存储结构、系统对象的定义和实现(IDL)等.下面具体介绍各章的内容.第
随着Internet的不断发展,网站越来越多,网站的制作技术也日新月异,但目前国内人们对网站的评价往往是基于内容的,对网站的一些性能的指标,比如下载的速度或链接的有效率,并无
基于面向对象的类测试,该文提出了一种生成类的合理的有限方法序列集和选取测试数据的方法.对于方法序列的确定,该文利用统一建模语言UML的状态图来自动生成类的合理的有限的
该论文的讨论的主要目标是建立一个可通过WWW访问的,可以产生和求值SET证书的系统.文中首先概述了电子商务的发展及SET在其中的地位.接着讨论了SET系统所应具有的主要功能,SE