面向Maven仓库的开源许可证选择研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:peixiaohe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着自由及开放源代码软件(Free and Open Source Software)的流行与开源社区的发展,基于组件复用的软件开发方式变得愈发常见。开源许可证不仅涉及到开发者自身权益的保护,也会影响着项目的开发、应用和发展。本文基于完成的国家云计算与大数据专项之开源生态模式及机制研究课题,针对开源许可证种类繁多且条款复杂的特点,面向Maven仓库开源组件的许可证选择为研究对象。以期促进开源软件的合规性使用,实现开源软件的可靠供应,从而贯彻落实发展开源软件的国家战略。针对开源许可证的选择问题,现有的研究聚焦于开源许可证兼容性分析、开源许可证选择工具、开源许可证实证分析三个方面。研究者通过收集Github、Source Forge等编程社区的项目开发数据,分析相应许可证的使用情况、趋势、特点等,为开发者提供经验性的指导。仅有少量的工作关注了软件包管理器(NPM、Ruby Gems、CRAN、Py PI)的开源许可证选择研究。Maven仓库作为迄今最大的软件包存储器之一,提供了大量成熟、可复用的开源项目数据,却缺乏面向该仓库的许可证选择相关研究。在当前组件复用开发方式成为一种趋势的情况下,已有的工作忽略了软件依赖这一项目特征,软件依赖项的许可证限制着最终软件系统的许可证选择。本文以该仓库的开源项目数据为研究对象,采用定量分析的方法。分析该库中项目选择许可证的特点和趋势,探索不同类型许可证的选择对项目开发速度的影响。充分利用Maven生态系统的开发依赖关系,构建了一种基于软件依赖的开源许可证选择模型。主要工作包括以下两个部分:(1)面向不同的开发社区、项目存储仓库,开源许可证的选择具有不同的特点和趋势。本文收集了部分项目相关数据,构建项目-版本-依赖项关系数据模型。在此数据集上统计了2009-2018年Maven仓库及Java、Scala、Java Script、shell、kotlin项目许可证选择分布,计算了100个最受欢迎的开源项目开发速度(版本发布周期)、按照OSI、Cpyleft、Permissive、SPDX、Multiple、Other六种类型分组开源许可证,采用定量分析的方法回答了以下问题:(1)Maven仓库中什么许可证使用较为普遍?(2)Maven仓库中开源许可证的选择情况是怎样的?(3)在Maven仓库中,不同类型的许可证对项目的开发速度是否有影响?基于对上述3个问题的回答,从软件包管理器仓库的角度为开发者提供开源许可证选择的经验。(2)现有的工作忽略了软件依赖这个关键因素,本文提出了基于软件依赖的开源许可证选择模型。分析了许可证选择如何受到软件依赖性和许可证兼容性的影响。在提出的方法中,先利用开源项目依赖项构建依赖网络并计算项目相似度;人工分析了部分使用在Maven软件包仓库中的开源许可证,进一步修改了原有的开源许可证兼容性图。基于兼容性图实现了一个检测许可证违规的过程。最后从Libraries.io数据集中随机选择测试项目集评估该许可证选择模型。结果验证了该模型有效性。
其他文献
黄栌(Cotinus coggygria)是一种优良的水土保持与园林美化树种,开展黄栌造林技术研究具有广阔的发展前景。种子繁殖是黄栌的主要繁殖方式之一,但因其种子具有坚硬且不透水的木质种皮和休眠胚,阻碍了水分的渗透,故而自然条件下发芽能力较低。为提升黄栌种子的发芽率,培育优质黄栌苗,本文以巫山黄栌种子为实验材料,采用不同沸水处理方式(室温纯水、自然冷却、立即冷却)、98%浓硫酸(H2SO4,比重1
西南地区露地蔬菜生产氮肥用量大和养分投入不合理等问题突出,加上区域性高温多雨和土壤风化淋溶严重等因素,导致蔬菜系统氮肥损失严重和环境代价高。因此,本研究采用田间试验和生命周期评价(LCA)相结合的方法,一方面,定量化评价不同减氮配施硝化抑制剂(DMPSA)氮肥产品对西南地区大白菜和辣椒生长发育以及农学、环境和经济效应的影响。另一方面,综合评价以减氮配施DMPSA氮肥产品为核心的土壤-作物综合管理理
在社交网络不断变化过程中,从微观变化层面上观察,各种信息在个体之间相互传递和改变,从而个体之间关系会根据接收到的不同信息发生不同的变化,这种关系在演变过程中可能增强或破裂;从宏观变化层面上观察,由于网络中个体的非线性相互作用,网络会形成一定的结构和功能。因此从两个方面剖析网络是非常有必要的。目前研究者大多关注单一类型网络的剖析,或者分析某一网络的特征。对网络这些特性分析固然重要,但是网络的特性都是
分形凝聚是自然界中常见的现象,如雪花的形成,晶体薄膜的生长,土壤粒子的凝聚等。分形分散也是比较常见的现象,例如水流的冲刷,土壤团簇的破碎等。团簇的凝聚与分散属于非线性过程,在随机过程中表现为自组织现象和自相似性,这些特征引起了学者一系列的思考。如团簇凝聚和分散的过程,外界环境对凝聚与分散过程的影响等,对于这些问题,学者们从未停止过探索。在传统实验方法中,学者们利用仪器进行研究,但在很多环境下传统实
目标检测一直是计算机视觉里的重要研究方向之一,受到众多学者的密切关注,其目的是判定输入图片中是否含有目标类别,并用边界框将目标包围起来。随着视频数据的快速增长,视频目标检测研究得以快速发展。视频目标检测将视频看作连续的图片帧,在每一帧上完成目标检测任务。视频目标检测在自动驾驶、视频监控、智慧城市等应用领域发挥着不可或缺的作用。然而,视频目标检测仍面临许多问题。视频中不可避免的运动模糊、怪异姿势和视
基因调控网络是生物学系统的一个强有力抽象,它对生命活动的控制是通过调控细胞内基因的表达水平来实现的。作为生物过程的核心,基因调控网络几乎控制着生物的所有细胞活动和功能,在生物的生命进程中发挥着至关重要的作用。基因之间的调控机制十分复杂,传统的湿实验很难挖掘其调控规律。构建高质量的基因调控网络是系统生物学领域一直以来都关注的热点问题。随着计算技术和人工智能理论迅猛发展,极大地促进了基因调控网络计算方
近十几年教育界持续关注教师专业质量的提升,教师质量直接影响着教学效果,成为教育变革的核心元素之一。自2018、2020年国家颁布《关于全面深化新时代教师队伍建设改革的意见》和《深化新时代教育评价改革总体方案》以来,构建科学专业的教师评价体系、推动教师队伍建设走向新高度成为关注的重点。设立职前教师专业标准并改善教师职前培训质量,是提升教师专业化并确保基础教育改革成效的基本前提。美国职前教师表现性评价
我国梨树的栽培面积和产量都稳居世界首位,2018年分别达到94万公顷和1640万吨,是世界梨果产业的重要支撑。但目前我国梨果单产水平刚达到世界平均水平,而单位面积化肥施用却是世界平均用量的三倍。我国梨园普遍存在施肥过量、比例失调以及肥料利用率低等问题,长此以往不仅增加了农民的经济负担,也影响了环境的持续发展,因此迫切需要一种科学高效的梨推荐施肥方法指导我国梨园生产。本研究以河北省梨园多年多点的田间
物象都有其形,虽然造形又分为平面造形和立体造形两种形式,但最基本的表现形式还是平面造形。“形”这个概念几乎是所有作者无法规避的问题,形的范围可以扩大到所有画面的可见因素,在绘画中可以将笔触、肌理和材料等划到“形”的范畴当中去,从形的角度去丰富表现技法,开拓创作的思路。近几十年来,岩彩这一美术概念的出现,备受中国美术界的瞩目,以中央美院实验艺术系教授胡明哲为领先的岩彩大军在本土掀起了一阵狂浪,将材质
著名书法家余仲九先生所编著的《小竹斋什记》中,将刘敦山作为川东书画界优秀的画家记载在书中,评价颇高。笔者通过对刘敦山相关资料的查阅以及山水作品的探析,深觉刘敦山的艺术修养深厚、成就卓著,但其在全国画坛却是寂寂无名,理应受到学界应有的关注和重视。学界关于刘敦山山水画的研究极其欠缺,认识和研究刘敦山最直接的突破口在于其留存于世的作品。据统计,找到刘敦山现存作品42件,其中山水画32件,花鸟画7件,书法