论文部分内容阅读
软件质量是软件使用者最为关心的问题之一,如何控制软件质量,开发出高质量的软件成为软件可靠性研究领域的热点。有效的软件质量预测可以在软件生命过程早期指导建立高效可靠的软件测试方案,以达到节约测试成本,提高测试效率,进而保证软件产品高质量的目的。本文将聚类算法应用于软件质量预测,并结合遗传算法对软件度量进行选择性分析,以达到更好的预测效果。
软件度量作为软件的内部属性,包含了软件各个方面的基本信息,而这些信息可以反映软件各个方面的基本属性和状态,从而,软件度量可以作为软件质量预测模型的输入,在软件生命周期的早期预测软件质量。
目前研究领域对于软件质量预测使用的方法主要是机器学习方法,聚类算法作为一种无监督的学习方法,不依赖于先验知识的存在,因此,使用聚类算法建立软件质量预测模型,可以在软件生命周期的早期预测软件质量。本文首先将三个经典聚类算法(K均值,模糊C均值,高斯混合模型)应用于软件质量预测,通过比较性实验及分析,详细阐述了聚类算法在软件质量预测领域的可行性及其优势。随后,本文将一新聚类算法(仿射传播)应用于软件质量预测,通过与K均值算法的对比,详细分析了其特点和优势,并在随后的软件度量选择分析部分将其作为主要预测模型进行了应用。
软件度量虽然可以作为模型的输入预测软件质量,但并不是所有的软件度量都适合于软件质量预测,对于不同的软件项目,很难通过经验人工的找到比较适合的度量集合。基于这个关键问题,本文提出使用遗传算法自动的优化搜索软件度量空间,对于不同的软件数据集,得到较为适合的度量组合,作为预测模型的输入。本文分别使用决策树以及仿射传播算法作为遗传算法的分类模型,通过多次实验证明,遗传算法可以自动的搜索到较为适合的软件度量组合,达到了软件度量的自动选择,大大提搞了软件质量预测的能力。