融合注释复用和程序解析的代码注释自动生成方法

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:yuyuxinmi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码注释(Code Comment)即用自然语言的形式论述代码背后实现的逻辑或功能,开发人员通过代码注释来认识掌握软件仓库中源代码描写的功能。软件开发随着互联网的迅猛发展也在不断高速发展,并伴随出现了大量的开源代码库。在软件开发过程中阅读并理解开源社区的源代码是一项耗时耗力的工作,如果源代码有相应的功能描述性注释,很大程度上简化并加快软件开发过程及速度,同时完善的代码注释也可以提高软件系统的可维护性。将软件仓库中的注释信息处理后映射到目标项目软件中的相似代码片段被称为注释复用(Comment Reuse)。程序解析(Program Parsing)即在优化注释的过程中会从代码和注释本身入手,分析代码的含义。但目前只有不到百分之二十的代码有对应的注释,开发人员如果手动为源代码添加注释,将消耗大量的人力与时间,因此自动生成代码注释成为研究领域的热门研究方向。现有的代码注释自动生成方法存在着一定的局限性,需要一种新的、有效的方法自动生成代码注释。本文以“自动生成代码注释”为切入点,针对注释数量稀少、质量不高的问题进行实验,为研究人员提供有价值、有参考意义的信息与数据。具体工作如下:1.基于克隆检测工具获得克隆检测结果并进行代码和注释的提取。注释复用的关键是找到软件仓库与目标项目软件的相似代码,然后进行提取。本文选用克隆检测的方式检测相似代码,检测工具选用Nicad,根据克隆检测结果对获得方法和语句的位置进行标记,设计多种启发式规则,结合这些规则从软件仓库的相应位置将克隆代码以及这些克隆代码对应的所有注释语句分别提取,构建注释候选列表,为接下来克隆代码的精简以及注释内容的优化提供基本数据。2.在已获取的克隆代码候选列表和注释候选列表的基础上,对克隆代码以及代码注释精简优化,获得高质量的克隆代码及代码注释。初步获取到的克隆代码和代码注释无论是自动生成还是手动撰写都存在克隆代码冗余、注释格式不规范、注释位置不合理、注释内容与代码不匹配等问题,通过一系列启发式规则以及程序解析的方法将克隆代码和代码注释优化。3.获取到高质量的代码和注释,进行“代码—注释”映射。获得的代码和注释有可能出现代码与注释是一对多的情况,通过计算代码段节点与注释节点重叠术语的数量,即相似性得分,将其进行排序,选择最高得分的代码注释进行映射,得到最终的文档。4.将得到的代码与注释映射文档进行多维度质量评估。人工评估自动生成的代码注释,选取具有Java编程经验的人员,为每位小组成员提供若干个随机选择的注释问卷进行评估;基线对照评估生成的代码注释,与目前该领域已提出的代码注释生成工具Clocom进行对比评估。经实验表明,本文融合注释复用和程序解析的方法在数量上平均每款软件提高12%,质量上平均每款软件提高5%,而且研究表明绝大多数参与者认为自动生成的注释在帮助他们理解代码时是准确、充分、简洁以及有用的。
其他文献
糖基化是一种功能多样、形式复杂的蛋白质翻译后修饰,其在细胞黏附,分子运输和清除,受体激活,信号转导,恶性肿瘤的发生和转移等过程中发挥重要作用。糖基化异质性又对肿瘤显著响应,变化迅速,预示着糖链/糖蛋白标志物具有巨大的潜力。结合珠蛋白(Haptoglobin,Hp)是我们早期运用传统的双向电泳技术在肝病血清中发现的重要差异糖蛋白,并对其N-糖基化修饰进行了详细的研究:发现其Asn241糖基化位点的占
在全球化时代的背景之下,世界各国之间都有着越来越密切地联系。不难发现,各国之间以合作交流的方式极大地促进了自身经济的发展。与此同时,合作这一概念在当今教育领域也发挥着越来越重要的作用,小组合作学习作为一种新型的教学形式,也正被普遍应用于课堂教学之中。但是迄今为止,关于小组合作学习的研究大多数还停留于理论研究的层面,只有少部分学者将小组合作学习的理论与实际课堂教学相结合。本文以高中思想政治课教学中的
目的前期发现Mex3c具有强烈的负能量平衡作用,本实验通过构建Mex3c基因缺陷小鼠来探究其是否通过诱导下丘脑c-fos的表达参与机体能量平衡的调控,并且观察Mex3c子代小鼠胚胎神经管发育是否存在缺陷,为后期探究Mex3c在神经管发生过程的作用研究提供理论依据。方法1:利用CRISPR/Cas9基因编辑技术,针对性设计Mex3c基因1-2外显子sgRNA,将小鼠mex3c基因的gRNA和Cas9
近年来,移动互联网络获得迅速发展。随着4G网络地普遍应用,5G网络地部署,移动应用程序(简称App)获得了迅猛的发展,并将长期处于增长阶段。品类繁多的移动应用程序为人们生活提供便利性的同时,也创造了巨大的经济效益。移动应用市场涌入了大量的开发人员。与传统软件相比,移动应用程序具有快速迭代的特性,尤其是较受欢迎的移动应用程序更新周期更短。这对开发人员来说是一个新的挑战。安卓(Android)系统拥有
已然类时间副词是汉语二语学习者的重难点之一。本文依据现有已然类时间副词的本体研究和习得、教学研究成果,分析已然类时间副词的语义、语法、语用功能,通过分析印尼汉语学习者已然类时间副词的习得偏误,提出了针对印尼学生的汉语教学策略和教学设计。全文有四个部分:第一部分阐述了选题缘由、研究目的和意义、研究综述、研究方法和语料来源,介绍了整体研究思路。第二部分首先确定了已然类时间副词的范围,然后从语义、语法、
在资本市场不断发展的现在,呼吁赴外上市的独角兽企业重返中国证券市场的呼声与日俱增。由于存在VIE结构,AB股票以及这些公司在境外注册的事实,所以,这些公司并不符合国内发
为了便于为客户提供更专业全面的服务,德科公司在全国42个城市设置督导岗位,负责客户门店管理工作。整个督导团队由于建立初期组建匆忙,同时各地区较为分散,随着公司业务不断扩展,各地区督导在工作能力上的欠缺也逐渐体现,作为直接接触客户的终端人员,督导团队水平直接影响客户满意度,公司想要开发扩展更多的业务,客户需要更全面完善的管理服务,随着对督导团队的工作要求越来越高,目前培训管理方案已无法满足督导团队的
马克思的著作中包含着丰富的生态思想,其中,对资本主义工业的生态批判,是马克思生态思想的重要组成部分。研究马克思对资本主义工业的生态批判思想,不仅对全面了解马克思的生态思想以及马克思的社会批判思想具有重要的理论意义,而且对深刻认识资本主义工业革命带来的生态恶果、资本主义的本质以及资本主义的未来走向都具有重要的现实意义。十八世纪发生的工业革命有力推动了人类社会的发展进步,尤其是使资本主义的生产力得到了
随着学术交流的国际化程度日益增强,学术论文的英译需求也逐渐增多,尤其是论文摘要的英译。本报告基于作者社会科学类研究论文摘要的汉译英实践完成。译者在校期间从翻译公司接收了大量的翻译任务。其中,论文摘要的英译占据了很大一部分。在此翻译实践中,译者从本人有关摘要的翻译实践中选取了28篇、共计一万余字(中文)的论文摘要翻译作为本次报告的材料,主要涉及教育、历史、文学、民俗等领域。在翻译过程中,报告描述了翻
体育赛事法律保护近年成为学界研究的热点之一,相关司法诉讼也引发热议。纵观相关文献和案例,大多是针对体育赛事节目的法律性质展开分析,而忽视了对体育赛事活动的探讨。事实上,体育赛事活动天然具有表演者权的表象,而反过来表演者权也足以涵盖赛事组织者和传播者的利益诉求。基于此,本文研究的问题为:以表演者权保护体育赛事活动作为体育赛事法律保护路径的合理性与可行性。本文首先通过实证研究指出我国体育赛事法律保护的