回归测试场景下基于分类挖掘的测试集优先化技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:gzhp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以提高回归测试成本效益为目标,对黑盒测试集优先化技术展开研究。成功软件在整个生命周期中会经历持续变更,造成回归测试频繁发生且开销巨大。提高回归测试成本效益一直是测试领域关注的问题。研究测试集优先化技术,提高回归测试有效性和效率,降低回归测试成本,具有现实经济效益。   工业实践中,系统级回归测试通常是防止缺陷流出的最后一道防线,其测试集通常使用黑盒方法设计和生成。学术界对黑盒测试集回归测试问题一直未有深入研究。测试集优先化是一种高实用性技术,适应具有时间资源约束的回归测试场景,且能够提高回归测试反馈速率。因黑盒测试目标、需求以及测试集设计思路方面的特殊性,现有大量基于代码覆盖的测试集优先化方法不适合黑盒测试场景。   针对黑盒测试集优先化场景,本文以提高有效测试用例执行效率为优先化目标,提出基于分类挖掘的新启发式方法。其中有效测试用例是指回归测试中能够发现缺陷的测试用例,尽早执行这些测试用例可以提高回归测试反馈速率。从概率论角度出发,定义回归测试随机试验,并在假定程序模块及测试集未经历大规模变更前提下,将软件演化过程中收集的不同版本回归测试历史数据视为独立重复试验结果。在此基础上提出新启发式:新版本代码变更条件下测试用例检测到缺陷的条件概率。新启发式估计新版本程序回归测试中测试用例检测到缺陷可能性大小,进而将测试用例按照检测缺陷可能性从大到小顺序排列,使更可能检测到缺陷的测试用例尽早执行,从而满足“提高有效测试用例执行效率”的优先化目标。   为计算测试用例在新变更条件下检测到缺陷的条件概率,新方法采用分类挖掘技术根据历史数据建立代码变更度量与测试用例执行结果的概率关系模型,并结合新版本变更情况预测测试用例在新版本下执行结果。新方法基于高效数据挖掘技术,理论上可以获得良好执行效率;因采用容易获得的度量,理论上还具有广泛适用性。本文实证研究部分通过3组实验验证新方法有效性、执行效率,并探索适宜此方法的分类器实现及其对不同数据集的适用性。   新方法易于扩展,理论上也可应用于白盒测试场景。除代码变更以外,新方法理论上还可使用二进制码、规约变更、需求变更等变更度量。这些扩展进一步提高新方法适用性。   本文主要贡献有:   1、总结前人工作,综述回归测试领域,尤其是测试集优先化领域已有成果。   2、从概率统计角度定义回归测试,给出回归测试随机试验定义。   3、提出新启发式“新版本代码变更条件下测试用例检测到缺陷的条件概率”。新启发式基于易采集的度量,理论上能够获得良好适用性及效率。   4、提出基于分类挖掘的测试集优先化方法。利用分类挖掘方法的高效性能够带来良好执行效率。   5、进行实证研究验证新方法有效性、性能,探索新方法适用分类器及数据集。实验结果表明新启发式方法具有良好有效性及效率。
其他文献
随着IPTV业务的迅速发展和用户规模的扩大,IPTV作为一项重要的电信增值业务如何融入到下一代网(NGN),成为人们关注的焦点。IP多媒体子系统(IMS)是构建统一多媒体业务的通用平
网页信息抽取是指从网页中(半)自动获取用户感兴趣的信息,其在信息检索、舆情监测等应用中非常广泛。然而现有的研究只注重精确度、召回率等传统指标,忽略了分析各类特征在抽取
基于QoS的主动兴趣管理技术将QoS引入主动兴趣管理系统,为用户提供可靠的服务保证,一定程度上提高了分布式虚拟环境的可扩展性。随着用户对于协作要求的越来越普遍,分布式虚拟环
随着科学技术的发展和进步,人类航天活动也越来越频繁,深空探测越来越受到各个国家的重视,近年来我国对深空探测也加大了投入。开展深空探测对于科技进步和人类文明的发展有着促
学位
数据库入侵检测技术是数据库安全的重要组成部分。目前的入侵检测系统采用模式匹配方法,虽然对已经存在的攻击具有很高的检测效率和正确率,但对很多未知的入侵攻击行为和方法
当今,Web应用已经成为人们获取信息、交流情感、开展工作、处理日常事务等的重要工具。它们改变了、并正在改变着人们的生活方式。为确保Web应用拥有者和使用者的利益必须开发
随着计算机与信息技术的发展,数据挖掘技术已经广泛应用到人工智能、模式识别、生物信息等许多领域。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理
复杂网络可以用来描述社会关系网络、生物网络、通信网络、网页链接关系等真实网络。从20世纪90年代,复杂网络概念提出之后,很多不同领域的研究者都开始关注复杂网络的研究,但是
工业生物技术知识环境建设及其e-Science应用是中国科学院信息化专项项目,本文即是以工业生物技术知识环境建设为项目背景展开。   工业生物技术(Industrial Biotechnology
概念知识是根据面向对象原理定义词汇涵义。本文提出此方法,以属性名及属性值定义一个词,将某一领域内的词汇构成层次或继承关系图,并按照表的形式将此图存储于数据库中,由此