【摘 要】
:
关于开源软件社区内开发者角色地位的研究一直是软件工程领域热门的研究课题。当前对于开发者角色地位的分类方案大多基于统计计数,存在片面性和局限性。而网络分析法在该课
论文部分内容阅读
关于开源软件社区内开发者角色地位的研究一直是软件工程领域热门的研究课题。当前对于开发者角色地位的分类方案大多基于统计计数,存在片面性和局限性。而网络分析法在该课题的应用得益于网络科学理论的发展,其较之于计数分类法,能够更为全面地分析社区内的开发者生态体系。在实验环节中,为了证明网络分析法在该课题研究中的优势性,本文首先依据开源社区的项目数据,分别使用计数分类法与网络分析法对开发者地位的分类效果进行综合比较,验证了网络分析法在该课题研究上的有效性和实用性。随后,为了对开发者分类问题进行应用方案拓展,本文以网络分析的思想,搭建了项目文件之间的交互网络,提出了一种新式的开发者地位分类指标,并证明其在开发者分类上较之传统方案有着精确度的优势。最后,为了对开发者分类问题得出具有普遍性意义的理论框架,本文将各类方法提取出的特征进行融合,以支持向量机分类算法为基础,建立角色分类器,用以从综合角度对影响开发者地位分类的因素进行分析和比对。同时,根据角色分类器的分析结论,多种分类指标的结合使用能够有效提高开发者分类模型性能。本文的研究内容主要包括:(1)讨论了开源社区数据的预处理和相关特征的提取方法,增强了数据的有效性和可靠性;(2)分析了传统计数分类法的研究方式,说明了其实用性的同时突出了其局限性;(3)依照网络分析的方法,将其分类性能与传统计数法进行了横向比较,证明其有效性和准确性的同时彰显了其在工程应用上的简易性;(4)基于网络分析的思想,根据项目文件之间的交互关系,提出了一种新的网络分析指标,同时证明了其有效性,用以进一步拓展网络分析法在该课题上的应用;以支持向量机分类算法为基础,建立角色分类器,实证分析了不同类型指标下的模型分类性能,同时证明多种指标的结合能够有效提高分类模型性能。
其他文献
脱氢表雄酮(Dehydroepiandrosterone,DHEA)作为机体胆固醇醇代谢过程中最重要的中间产物,可直接或在靶器官相关酶系的转化下而间接发挥其广泛的生物学作用。研究表明,DHEA降
电视辩论是台湾选举活动中的一大传统。本文选取2012-2016年台湾地区“大选”电视辩论节目为研究对象,分别就国民党和民进党候选人的叙述文本进行定性与定量研究,旨在把握不
从非法集资到对赌、再到股权众筹案件,囿于具体规定的空白与残缺,金融体系对新兴金融产品有天生的恐惧:具体来看,行政执法、审批部门对金融行为性质的甄别滞后,尤其在金融管
近年来,随着以风电、光伏为主的可再生能源发电占比大幅提升以及配电网形态呈多样化发展,电网电压稳定问题愈加严峻。为提升不确定性环境下电网对电压动态过程的响应能力,可
以往学者研究认为,当业务量按相同比例增加或减少时,费用支出变化的比例相同。然而,Noreen、Kaplan(1998)和Cooper等在对实例进行研究的过程中发现两者之间的变化并不是成比
目的RTN4是定位于内质网的网状蛋白家族成员蛋白,广泛参与神经细胞内分泌和膜转运等多种生理病理过程。研究表明,RTN4与Bcl-2和Bdl-XL样家族存在相互作用进而在人类癌症细胞
外贴FRP加固钢筋混凝土结构是目前最受青睐的结构加固修复技术之一。FRP与混凝土界面粘结性能是外贴FRP加固混凝土结构技术的关键和核心问题。FRP与混凝土界面的剥离问题,降
在当今世界科学技术的高速发展下,机械手的应用领域越来越宽。目前在工业生产、宇宙测量探测、深海区域开发、军事活动危险排查等领域中,机械手有着越来越多的应用。故而对机
目的健康女大学生CMV排毒特征前瞻性队列研究,旨在分析外源暴露机会小的健康育龄女性感染及排毒特征,进而推测妊娠妇女孕期的感染及排毒特征,阐明垂直传播过程中的病毒学作用
随着信息技术的迅猛发展,制造业生产过程规模的不断扩大,复杂性日益提高,产生的数据越来越多,从海量的数据中挖掘出有效的信息,从而提高生产过程的安全性和可靠性,提高产品的