抄袭C源代码可视化智能检测方法与实现

被引量 : 0次 | 上传用户:shaw1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
源代码抄袭检测,是识别程序代码相似性的一项重要应用。本文针对计算机编程语言教学考核中对程序设计客观性和真实性的要求,寻找能够智能识别C程序抄袭代码的方法,实现具有高效率、操作便捷的可视化检测目标。通过对抄袭代码类型和识别方法的研究,本文从两个方面提出对学生作业抄袭代码识别和检测的方法。首先针对学生作业程序代码实现功能简单、代码长度短、数据结构和类型单一,但数量较大的典型特点,提出了基于特征属性向量空间模型的聚类方法。该方法通过提取能够代表源代码特征的属性建立属性向量空间模型,引入向量空间聚类算法划分抄袭类,可在较短时间内快速识别出有抄袭嫌疑的源代码。其次在获得疑似抄袭源文件的基础上,为了获得更加直观的可视化检测效果,从识别两个源文件抄袭区域的角度,本文提出了基于结构度量的SMR段匹配识别方法,通对两个源文件的过结构分析划分功能代码段,并引入RKR-GST串匹配算法,在单词的层面上对两个源文件进行段匹配,从而识别出相似度高于阈值代码段,获得定位抄袭区域的可视化的检测效果。基于以上识别方法,设计实现了抄袭C源代码可视化智能检测系统,构建了抄袭代码检测评价体系,为检测结果提供客观可靠的评价依据。通过测试表明,检测系统能够实现对常见类型抄袭代码的检测识别,对于作业程序中多见的高相似度抄袭程序效果显著。该系统还在实际课程考核中得到应用,能够准确识别80%以上的抄袭程序,对提高教学质量和改善学生学习效果起到了良好的促进作用,表现出了很强的实用价值。
其他文献
近年来,无花果产业在广东地区发展迅速。本文从现有品种、栽培模式、经济效益等方面综述了广东无花果产业的发展现状,总结了广东无花果产业的优势与存在的问题,在此基础上提
如何解决网络功能虚拟化(NFV)后复杂的管理问题、如何对网络进行灵活调度,是NFV发展亟需解决的问题。人工智能技术的兴起,为NFV系统内的管理和编排提供了新的解决方案。对NFV
文字、语言、文化三者相互制约使得语言得以稳态发展。汉字经过两千多年的发展,经历了多次外来语的高潮,文字系统符号虽未发生变异,但汉字表意的同质性规律却被打破
会议
采用夏冬季平茬栽培技术并结合冬春季加温,研究了‘玛斯义陶芬’(MasuiDauphine)无花果周年丰产栽培技术。结果表明,在北京地区冬季平茬不加温日光温室果实发育期为92d,果实
①目的研究MicroRNA10b(miR-10b)与HOXD10在子痫前期疾病患者胎盘中的表达。②方法选取2017年11月~2018年7月唐山工人医院剖宫产分娩的子痫前期患者14例(子痫前期组)、子痫前
自80年代初以来,我国海水贝类养殖业得到了迅猛发展,目前已成为我国北方海洋经济的支柱产业之一[1]。其中,牡蛎养殖业规模逐年扩大,年产量已位居世界首位[2]。然而,时常爆发
<正> 前言考古绘图是把制图学应用于考古学研究的一门技术。自考古学诞生时起,考古绘图就贯穿于考古工作的始终,它用制图学的理论和方法形象地记录和说明考古发掘材料,是考古
1.统计文化的主要内容。物质的统计文化包括统计机构、统计工作条件、统计产品的载体等。精神的统计文化包括统计活动的指导思想、统计部门的行业风气、统计队伍的职业道德和工
防范系统性金融风险和防治环境污染,是新时代两大发展难题,绿色信贷是破解两大发展难题的关键。绿色信贷发展初期收益低成本高的规模不经济必然会影响银行利润,长期对其财务
2008年全球金融危机以来,国际经济持续低迷,各国纷纷把眼光集中于战略性新兴产业的发展,以期望实现产业优化升级,打破经济僵局。作为发展中大国,为实现经济跨越式和可持续发展,中国