基于Transformer和卷积神经网络的代码克隆检测

来源 :郑州大学学报(工学版 | 被引量 : 0次 | 上传用户:ptcptsu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的代码克隆检测方法往往作用在代码解析成的词序列上或是整棵抽象语法树上,使用基于循环神经网络的时间序列模型提取特征,这会遗漏源代码的重要语法语义信息并诱发梯度消失。针对这一问题,提出一种基于Transformer和卷积神经网络的代码克隆检测方法(TCCCD)。首先,TCCCD将源代码表示成抽象语法树,并将抽象语法树切割成语句子树输入给神经网络,其中,语句子树由先序遍历得到的语句结点序列构成,蕴含了代码的结构和层次化信息。其次,在神经网络设计方面,TCCCD使用Transformer的Encoder部分提取代码的全局信息,再利用卷积神经网络捕获代码的局部信息。再次,融合2个不同网络提取出的特征,学习得到蕴含词法、语法和结构信息的代码向量表示。最后,采用两段代码向量的欧氏距离表征语义关联程度,训练一个分类器检测代码克隆。实验结果表明:在OJClone数据集上,精度、召回率、F1值分别能达到98.9%、98.1%和98.5%;在BigCloneBench数据集上,精度、召回率、F1值分别能达到99.1%、91.5%和94.2%。与其他方法对比,精度、召回率、F1值均有提升,本文方法能有效检测代码克隆。
其他文献
<正>2022年版《艺术课程标准》提出:“义务教育艺术课程要让学生在审美实践中去感受、体会、持续理解艺术的魅力。”而当前教学模式之下,学生对知识的掌握常常是以考试为目的的模仿与背诵,学习的目的也只是应对考试,考完就忘成为学习常态。这种学习状态之下,学生对所学知识缺少理解或者完全没有理解。那么,作为课程设计者,教师该如何在课堂中提高学生对美术学习的兴趣,帮助学生在美术实践中体验与理解所学内容?以及该
期刊
报纸
《新前采茶舞》又称《黄岩采茶》,是流传于浙江省台州市黄岩区新前一带的民间舞蹈,常作为劳动丰收、节庆节日中不可或缺的节目之一。20世纪80年代,“六五”跨“七五”国家重点科研项目《中国民族民间舞蹈集成》(浙江卷)、1997年,全国艺术科学“九五”规划重点项目《中华舞蹈志》(浙江卷)入编了《黄岩采茶》;2009年,《新前采茶舞》被列入第三批浙江省非物质文化遗产名录。因此,作为浙江民间采茶类舞蹈中具有代
<正>内部审计是伴随现代企业制度而诞生并逐步走向规范化的,稍具规模的企业都会设立专门的内部审计部门,规模较小的企业也会有类似的部门承担类似的职责。内部审计诞生之初的职责就是查错纠弊,当然,随着企业规模的扩大,企业经营管理措施的多样化,以及外部环境的不确定性增加使企业面临的经营风险增加,内部审计的职责和功能就不再局限于查错纠弊了,常见的还有经营评价和管理咨询,以及企业高层管理者专项交办和关注的各种查
期刊
为保证电梯运行的安全、稳定、节能,故障维修方便等,设计基于S7-1500PLC的电梯监控系统。在TIA Portal下完成控制系统的CPU、I/O模块、WINCC的硬件组态和程序的编写。该系统不仅实现了电梯的基本功能,还能通过上位机画面和1500PLC的Web server功能对电梯运行情况进行实时监控。通过PUT/GET与电梯仿真软件进行通信调试得出:电梯运行可靠、稳定,能够有效地降低能耗,提高
音乐作为一种以声音为表现手段的艺术形式,在形成过程中,是主体心理结构、生活阅历、知识结构等的外化。与西方音乐美感的体现不同,中国音乐自远古时期就与诗礼联系在一起,侧重于“中和”之美,追求意境以及“天人合一”之美。这种美感的产生是由社会、历史、文化、知识结构等建构出来的,正是这些因素产生的美感决定了审美意识。文章指出,人的听觉感性需要使音乐具有了艺术功能与实用功能,音乐的实用功能具有教化作用,而审美
艺术是人类在长期生产生活中创造的杰作与产物,文学、美术、戏剧、音乐等具有创作者主观的感情色彩,是个性化的艺术处理和表达,也是对客观事物思考的结果。艺术家通常具有发散性思维和丰富的想象力,以及对外界事物敏锐的洞察力。艺术是美的象征,是美学价值观的直接体现。美的本质在不同时期有不同的历史内容。本文主要从动、静、虚、实四个方面论述艺术创作中的审美特征,进而体现审美追求在艺术创作中的重要意义。