【摘 要】
:
近年来,开源生态与开源软件发展十分迅猛,越来越多的开发者都参与到开源软件的开发中。在开源生态社区中开发者可以自由自在地同时进行多个任务,通过互联网环境实现交互和协同。例如在Git Hub社区中开发者可以同时关注讨论多个开发任务,或者同时审阅讨论多个代码贡献。大规模群体的积极参与和多任务协同是开源生态持续成长的关键因素和重要驱动力。探索多任务协同对开发者工作效率的影响是十分有意义的研究,可以指导开发
论文部分内容阅读
近年来,开源生态与开源软件发展十分迅猛,越来越多的开发者都参与到开源软件的开发中。在开源生态社区中开发者可以自由自在地同时进行多个任务,通过互联网环境实现交互和协同。例如在Git Hub社区中开发者可以同时关注讨论多个开发任务,或者同时审阅讨论多个代码贡献。大规模群体的积极参与和多任务协同是开源生态持续成长的关键因素和重要驱动力。探索多任务协同对开发者工作效率的影响是十分有意义的研究,可以指导开发者更好地进行多任务协同。本文主要围绕开源生态中的开发者多任务协同问题,立足于开源社区积累的软件开发大数据,分别从issue、pull-request两个层面系统地开展大数据驱动下的开发者多任务协同机理研究,深入剖析开源生态中开发者多任务协同的内在机理。主要工作内容与贡献如下:第一,针对GHTorrent数据库中开发数据不够全面、更新不够及时问题。我们提出了基于redis的开发者多任务数据采集技术研究。我们通过redis中间件分布式方法,充分挖掘收集出蕴含在Git Hub项目仓库中的历史开发者多任务开发信息。我们通过该数据采集技术充分采集了Git Hub平台中Forks数量排名前1000的项目开发信息,为后续开发者多任务协同研究的开展打下数据基础。第二,针对开源生态社区Git Hub中多pull-request审阅(multi-reviewing)对pull-request处理效率的影响,我们提出了基于香农熵的多pull-request审阅关注度模型,发现了multi-reviewing对pull-request处理效率的影响规律,为开源生态中开发者进行multi-reviewing提供实践建议。第三,针对开源生态社区Git Hub中多issue讨论(multi-discussing)对issue解决效率的影响问题,通过定量分析方法发现了multi-discussing对issue解决效率的双重影响规律,进一步深入分析了双重影响规律的内在原因。我们也利用问卷调查方法分析了开发者对multi-discussing的经验与期望。从而从定量分析和定性分析两个角度发现并总结了multi-discussing的最佳实践。综上所述,本文主要研究了开源生态中的开发者多任务协同与开发者开发效率影响关系的内在机理。本文的研究对于开源生态分析,开源生态世界中的群体化开发具有重要的理论指导意义,也对开发者优化生产力,整合开发配置资源有重要的实践指导意义。
其他文献
随着视频监控头的海量增长,智能视频监控系统在社会上有着越来越多的迫切需求,尤其是在智能安防、智能交通管理、智能医疗等领域。其中,视频异常检测是智能视频监控系统的核心技术。在有监督的条件下,视频异常检测会消耗大量的人工成本、物资、时间等进行数据的标注;而无监督的异常检测可以很好地克服这些不足,但宥于没有先验知识作为依照,目前开展的研究相对较少。本文着眼于无监督视频异常检测技术和应用,主要开展了以下两
程序自动修复技术为软件调试、软件维护等任务带来了极大的便利,因而引起了研究人员的广泛关注,越来越多的方法被提出以更好地解决修复问题。然而,这些技术在测评环节中存在着多种偏差,使得研究人员不能够全面地客观地分析当前技术的修复能力。本文针对当前的修复工具测评环节中的三类偏差进行研究,内容涵盖程序修复流水线上三个环节(缺陷定位,补丁生成,与补丁验证)中的两个(缺陷定位与补丁验证)以及缺陷数据集的选取,旨
近几年来,深度卷积神经网络(Deep Convolution Neural Network,DCNN)在语义分割任务上取得了显著的进展,极大地提高了语义分割的准确性以及处理效率。在自动驾驶视觉传感器采集的图像中,语义分割方法通过像素级的标注及时精准地获取道路空间方位和障碍物轮廓等信息,已经成为驾驶视觉场景下实现自主规划和主动避障的主流解决方法。对于这类对实时性要求高的应用,如何在保持高效的推理速度
作为现代图像系统的重要部分——多光谱与高光谱图像为探测地物目标提供了丰富的空间信息与光谱信息,在民用与军事领域均有很深的应用价值。与其相关的图像处理技术包括图像搜索、增强、融合、语义分割、异常检测与图像分类等。本文针对多光谱图像融合技术与高光谱图像分类技术进行了深入研究,主要工作包括:(1)本文提出了一个由RLNSST算法与引导滤波器结合的新型融合算法。在深入理解图像融合技术基本理论的基础上,本文
作为一项典型的计算机视觉任务,人群计数的目标是精准高效地统计视频或图片等载体中所含有的总人数。目前,人群计数任务已在公共安全领域的诸多方面得到大力推广和积极应用,越来越多的学者开始将其作为研究课题进行专项讨论。基于采取的方法或者手段,可将人群计数大体划分为两种:一种是基于回归的人群计数,它主要通过创建的回归模型进行人数统计;另一种则是基于检测的人群计数,它依托成熟的目标检测技术对特定场合中包含的人
随着倾斜摄影测量技术、无人机技术和三维重建技术的快速发展,大范围场景下倾斜摄影测量数据的生产速度有了大幅提升。处于信息化时代的人们,也越来越希望能够通过多种多样的科学技术手段了解自己所处的环境,二维影像所提供的信息已经远远不能满足人们的需求,面向三维可视化的需求越来越多。虽然面向三维web可视化的研究有了诸多进展,但是大范围场景下倾斜摄影测量数据的可视化仍存在诸多问题。例如,分层级数据加载过程中,
近年来,随着开源生态的迅速发展,积累了大量的开源软件资源。在这些数目庞大的软件资源中,不乏质量很高的代码片段,以及其衍生品,如代码摘要、文档等。这些高质量的资源具有丰富的价值。然而在海量的开源资源中,如何挖掘出这些高质量的开源资源,使其能够复用于未来的软件工程之中,仍然面临着许多挑战。本文认为面对大数据背景下的开源资源,需要从两个方面进行着手:理解代码与定位代码。因此,本文提出了进行了如下研究:1
模糊测试是一种常用于软件测试中的技术,其中,灰盒模糊测试技术因为具有覆盖率信息反馈以及快速生成用例的特点而应用广泛,但是它需要大量时间去产生测试用例覆盖程序,所以测试效率仍较为低下。现如今计算资源规模庞大,利用分布式计算资源可以加速灰盒模糊测试过程,这个方法区别于传统改进算法,并与其他方法可以相互增益。本文针对大规模分布式并行的持续性模糊测试技术展开了研究。第一,本文采用了以数据库为中心的架构用来
伴随着开源理念的赓续提高,开源社区的发展日新月异,孕育了海量的开源软件,软件资源高度分散而且良莠不齐,难以用传统单一、封闭的方式对开源软件进行评估进而检索优质软件。因此,提出一种新的开源软件排序算法是非常有意义的。本文提出了一种对软件进行综合评估的新方法,从客观和主观两个层面来综合评估软件。客观上采用文本匹配及基于隐式的结合方法,建立开源软件在软件主体社区及软件衍生社区的关联,进而量化软件在软件衍
自然语言理解是任务型人机对话系统中的基础性研究工作,对于给定用户输入,旨在把自然语言转换成计算机能够理解的结构化语义表示。自然语言理解由意图识别和槽填充组成,其中意图识别完成对用户意图的判断,槽填充完成对用户输入实体的抽取,通常使用多任务学习来同时完成两个任务,相关技术目前成为学术界研究的焦点。本文基于深度神经网络模型,对自然语言理解任务进行了研究,研究内容包含两方面:首先,自然语言理解模型通过使