基于神经网络的软件缺陷分派和数据误用研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:zzyp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了方便地管理软件缺陷,许多大规模开源项目使用软件缺陷追踪系统,以缺陷报告的形式记录、管理缺陷。软件缺陷分派是软件缺陷管理中的重要步骤,目的是分派合适的开发人员修复缺陷。缺陷修复效率对软件质量有重要影响,而高效地修复缺陷需要及时准确地分派开发人员。在大规模开源项目中,不仅每天新增的缺陷报告数量多,而且项目中存在的开发人员数量也很多。因此,软件缺陷分派需要耗费大量人力成本和时间成本。为了提升缺陷分派的效率,许多研究提出预测修复人员的方法。其中最新的一类方法使用神经网络建立分类模型。但目前这类方法使用的数据集和参数设置都存在差异,难以进行对比。因此本文根据这类方法中模型的主要特点构建相似模型,并在同样的数据集和参数设置下进行实验,从而便于对比。此外,本文使用注意力机制、标签平滑尝试改进现有模型。最后,由于缺陷属性可能会随时间而变动,如果使用错误时间点的属性值进行测试,有导致模型效果虚高的风险。因此,本文使用不同时期的属性值来研究数据误用对模型效果的影响。本文的主要研究内容有:一、以缺陷基本属性如文本和组件为特征,使用卷积神经网络、循环神经网络和注意力机制构建模型。二、以缺陷派生属性组件内历史修复人员序列为特征构建模型,探索人员序列本身和根据人员序列计算的动态标签平滑对模型效果的影响。三、探索增加缺陷报告提交者特征对模型效果在整体上及不同类型缺陷报告上的影响。四、探索由属性变动导致的数据误用对模型效果的影响。本文的主要结论有:一、特征对模型效果的影响程度远大于网络类型对模型效果的影响程度。单独使用派生属性特征的模型就能得到比使用基本属性特征的模型更好的效果。二、动态标签平滑可以提升预测修复人员中靠后部分的准确率,静态标签平滑可以提升预测修复人员中靠前部分的准确率。三、加入缺陷提交者特征后的模型效果提升,基本来自于缺陷提交者同时为缺陷修复者的缺陷。由于提交者可以直接将缺陷分派给自己,因此在实际应用中这部分提升的价值有限。四、各种属性变动对模型效果都有明显影响,属性变动的影响程度从高到底依次为历史修复人员序列、组件、文本。
其他文献
【摘要】《电测仪表》课程作为高校电类专业的一门专业课,具有非常重要的实际应用意义。本文从多媒体教学、激发学员兴趣、提高学员动手能力和创新能力等方面阐述了《电测仪表》课程的教学改革方法。通过实践证明,对《电测仪表》课程教学方法的改革,使学员更加乐于去学习。对创新型人才的培养起到促进作用。  【关键词】电工测量;教学方法;改革;教学模式;教学质量;  【中图分类号】:TIM93 【文献标识码】A 【文
近年来,软件规模不断扩大,软件行业已经从一项最初依赖个人编码能力的技术领域演化成一个越来越复杂和精密的系统工程。在软件工程应用中,软件产品作为最终项目的产物,往往被
摄食限制(Dietary restriction),又称能量限制(Caloric restriction)或食物限制(Food restriction),是所摄取食物中的蛋白质、碳水化合物、脂肪含量的相互平衡的减少。大量研究
随着地铁的快速发展和城市化的加速,地铁不再是一个普通的城市轨道交通系统,被赋予了承载城市名片的寓意。自1969年北京第一条地铁开通到2011年西安地铁的运营,全国已有35个城市开通地铁,多数城市在工业化地铁空间中,用静态、传统艺术化表现形式来提升地域文化。但是随时间的发展,这种较为多见、普通的表达方式不再满足地铁空间发展的要求,能够让市民驻足欣赏的时间也随之缩减,更不便城市文化的传播。本文以数字媒
“考世系,知始终”,“少年强则中国强”唤起了“学生之手足体力”关系到一国富强之效的觉醒。释义出一个国家的学生体质的状况是其潜在综合国力的重要组成部分,与这个国家的
随着我国经济社会水平的发展,人口老龄化趋势已经越来越明显。老龄人口的迅速增加使得我国长期以来保持的人口红利消失、经济增速持续下降,同时给社会养老、医疗等资源带来了巨大的压力,解决老龄人口的医疗和养老问题是目前我国政府需要关注的重点方向之一。医养结合是破解我国老龄化趋势的必经之路,该模式能有效整合养老和医疗资源,满足人口老龄化带来的刚性需求。鼓励PPP模式引入医养领域,不仅是当今市场准入中的流动资本