论文部分内容阅读
随着全球化的影响日益增大,教育已经从重视一般语言逐渐的转向为重视学科语言。数学语言是一种简洁、准确且其自身概括能力强的一种语言,它不仅在人文学科、自然学科等领域具有广泛地应用,还是所有学科语言的核心。作为国民教育起点的小学数学课程,不仅承载着打基础的重要作用,更是受到国内外教育工作者的关注。小学数学不仅是传授数学的基础知识,还可以培养小学生的心理素质及头脑的灵活性,对学生以后的成长道路具有非常大的帮助。对小学数学语言的研究不仅有助于提高教学质量,更能加深学生对数学的理解及应用。针对利用智能技术解决小学数学语言方面问题缺乏语料库支持的现状,本文以2013年-2019年考试真题和相关知识点作为语料库的研究对象,使用MATTER循环法对小学数学语料库进行构建研究。首先对具体的语言现象创建模型和规格说明,按照规格说明对知识点与复习题进行标注,接下来使用刚刚创建的标注语料库进行机器学习,对结果进行评价并修改模型和算法。随着建模标注循环和训练测试循环,一旦在原有模型上进行了增加或修改,MATTER循环将重新进行一遍。这个过程虽然繁琐且费时,但可以极大地提升算法的性能和数据的准确性,为创建黄金标准语料库提供了方法论。本文的主要研究内容包含以下三部分:(1)小学数学考题的现象建模及标注。本文共收集了1480道小学数学题型,并将这些题型分为三大类:数与代数类题型、空间与图形类题型和统计与概率类题型,根据对知识点的分析建立知识结构体系,对知识点进行难易程度和考察比例的综合分析,建立标注模型并根据该模型,使用GATE标注工具对生语料进行标注。(2)自动标注的实现及描述。基于刚刚创建的语料库进行机器的半监督学习,此过程将语料库分为训练集、开发—测试集和测试集三部分。训练集用于训练任务中使用的算法,开发—测试集用于错误分析,最后在预留的语料测试集上运行。根据测试结果更改模型,以便改善之后的数据更接近黄金标准,进而改善自动标注算法的性能。(3)面向小学数学学习者语料库的有关应用。构建了基于Web技术的小学数学语料库系统,其主要提供知识点查询与搜索相关试题的功能。前台界面主要提供了知识点与相关题型的模糊输入,系统根据输入进行快速处理,并向用户展示相匹配的知识点与试题清单;后台界面主要面向管理员,其提供了管理员查看、录入、删除、修改等管理的功能。通过构建的语料库,并根据知识点的定义、题型的提问方法结合相关公式归纳解题规则,这些规则将通过Python语言进行标注和存储,使用这些规则进行“存题”—“识题”—“解题”的机器求解过程,并举例说明Python的解题效果,从而说明构建的语料库拥有实用性和有效性。