跨项目缺陷预测中训练数据选择方法

来源 :计算机应用 | 被引量 : 3次 | 上传用户:liongliong591
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨项目缺陷预测(CPDP)利用来自其他项目的缺陷数据预测目标项目的缺陷情况,为解决以往缺陷预测方法面临的训练数据受限问题提供了一个新的视角。训练数据的质量将直接影响跨项目缺陷预测模型的性能,因此,需尽可能选择与目标项目更相似的数据用于模型的训练。利用PROMISE提供的34个公开数据集,从训练数据选择方面,分析了四种典型的相似性度量方法对跨项目预测结果的影响以及各种方法之间的差异。研究结果表明:使用不同的相似性度量方法选出的训练数据质量不同,其中余弦相似性与相关系数两种方法效果更好,且最大改进比例达
其他文献
本文通过对SO2风机测试,分析SO2风机综合效率低的原因,提出了降低速比、减少液力偶合器损失等改造措施,收到很好的节能效果。
有位诺贝尔奖获得者说过这样的话:要解决人类的终极问题需要到东方汲取孔子的智慧。中国作为文化大国一直在世界文明中占有一席之地,而且曾经绚烂夺目,赢得世界人民的广泛尊崇。