高中藏文作文抄袭检测原型系统研究

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:Java8657
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,学生抄袭网络资源的现象屡见不鲜。在高等教育领域,已有一些针对学生论文剽窃检测的研究,但在藏文等低资源语言领域,针对学生单语言作文抄袭检测和跨语言作文抄袭检测问题,还存在着大量的研究空白。高中生正处于人生学习、生长的关键时期,此时,正确的学习观对于学生未来发展和个人能力的培养具有重要影响。语文学科中作文部分属于学习的重难点之一。面对写作困难,许多学生会选择互联网上的海量资源作为参考,其中不乏有人使用直接或间接方法进行抄袭,这种抄袭行为既不利于学生写作能力的发展,也给教师作文评判增加了工作量,同时还影响了营造学习的公平性环境。目前已有的抄袭检测系统大多适用于论文抄袭检测,根据文章摘要、参考文献、论文结构等进行检测。学生作文与论文不同,首先它不具备论文所具有的“摘要-正文-参考文献-致谢”文章结构;其次学生的作文内容相较于论文更加口语化、抒情化,且具有“引经据典”的写作手法,这一点在实际教学中不能被认定为抄袭。但学生作文抄袭检测和论文抄袭检测本质上都是一种文本相似度检测过程。因此学生作文抄袭检测和论文抄袭检测有相通之处,但也存在差异。本文在已有的论文抄袭检测研究基础上,进行学生作文的抄袭检测研究。本文针对高中藏文作文抄袭情况进行研究,其中抄袭的类型大致可以分为三种:复制型抄袭、语义改写型抄袭和跨语言翻译型抄袭。并根据每一种抄袭类型提出一种检测方式,构建出一个适用于藏文高中作文抄袭检测的原型系统。主要研究内容如下:针对复制型抄袭的检测:本文基于最长公共子序列算法,处理藏语高中作文文本中的连续复制型抄袭。经过实验,在篇章层面的最长公共子序列方法可达到92.7%的准确率。针对语义改写型抄袭:本文采用基于注意力机制的孪生长短时记忆网络模型,训练藏文音节向量作为模型输入,训练藏文作文语义改写抄袭检测模型。实验表明,本文所使用方法的皮尔森相关系数可达0.6010。这表明算法计算出的相似度值和人工标注的结果达到了强相关程度,准确率较高。针对跨语言翻译型抄袭:本文采用基于注意力机制的孪生长短时记忆网络模型,依靠人工构建的藏汉词典,训练藏汉跨语言词向量,进行藏汉跨语言的作文抄袭检测研究。实验表明,本文所使用的方法皮尔森相关系数可达0.4780,这表明模型输出值和人工标注值达到了中等程度的相关。最后,本文融合以上研究内容,设计并实现了面向高中藏文作文抄袭检测的原型系统。系统面向使用藏文作文的教师和研究人员,实现了作文自动抄袭检测功能,能根据单语言、跨语言分别检测,提供上传作文的相似度值以及抄袭句子对比。整个系统操作简单明了、实用高效,为学生日常藏文作文抄袭检测提供了良好的技术支持。
其他文献
近年来,随着科技的发展,环境污染问题也越来越严重,利用半导体材料的光催化技术来处理环境污染受到广泛关注,但半导体材料在光催化时也存在一些问题,主要是光生电子与空穴的
本论文以诗人别称为切入点,以黑格尔美学中的“感性心灵化崇高”为基础,通过对T县初中语文教师教学过程中的教学现状进行分析,研究古诗词教学过程中诗人的感性心灵化崇高。旨
近年来,恶性肿瘤的发生率和死亡率持续上升,成为威胁人类健康的第一大疾病。研究有效的恶性肿瘤诊疗方法已经成为肿瘤医学领域的一大热点问题。而利用医学影像技术获取肿瘤结
本文利用有限差分法对五次非线性Schr(?)dinger方程的初边值问题进行数值研究,构造了两个四阶紧致有限差分格式,并运用“抬升”技巧和标准能量法建立了格式的最优误差估计.第
花园铜矿位于塔里木盆地西南缘的喀什凹陷北缘中。前人对花园铜矿鲜有研究,公开发表的论文较少,对花园铜矿的矿物学研究更是一片空白。通过对花园铜矿的矿物成分、结构、构造
自仿测度μM,D是由仿射迭代函数系{φd(x)=M-1(x+d)}d∈D唯一确定,关于自仿测度有很多开放性的问题,很多学者主要关注在什么条件下μM,D是谱测度或者非谱测度.在前人研究的基础上
据估计,世界上约30%的油气资源储存于砂-泥岩薄交互层中,这种薄交互储层可等效为宏观的单轴各向异性地层(或称横向均匀各项异性地层,简记为TI地层),探测和识别这类地层对于油
2016年最高人民法院下发《关于开展家事审判方式改革和工作机制改革试点工作的意见》,该意见明确指出,要探索引入家事调查员,不断提升家事审判的司法服务和保障水平。家事调
互联网技术的发展将我们带入一个新的时代:互联网+时代。通过互联网+这个平台,我们可以深度的融合众多的传统行业。传统行业借助互联网+这个平台可以有效地拓展自己的业务,很
骨器在史前时代的生产生活中占有重要地位,随着考古技术的发展,近年来松嫩地区的骨器材料陆续被公布,为东北地区的骨器研究提供了宝贵的资料。本文从松嫩地区北部新石器至青