论文部分内容阅读
随着现代教育技术和人工智能技术的迅速发展,对学科题目机器解答的研究再一次变得火热起来。相较于其他学科,数学是一门以数量和关系为基础的学科,研究数学题目的机器解答是研究机器解答技术的一个很好的切入点。本文为了帮助实现平面几何题目的机器解答,对题目平面几何图像中实体信息的抽取和表示问题进行了研究。针对几何实体检测过程中遇到的图形重叠结构、虚线等情况,根据平面几何图像的特点,有针对地测试了实体检测的相关算法,并提出了多种后期优化处理策略,实现了较为鲁棒的实体检测流程和较高的检测精度。并随后从检测结果中抽取出了几何实体的有用信息,这些信息既可以通过一致化表示作为结果直接展示,帮助学生理解并自主探索题目的解答,又可以和文本信息整合,得到题目更为完整的信息,帮助实现平面几何题目的机器解答。本文研究内容主要包括两个部分。第一个部分是几何实体的检测部分,主要包括图像预处理、几何实体检测和检测优化三个步骤。通过实验分析与比较,本文选取自适应高斯核二值化算法对平面几何图像进行二值化,并对二值化后的图像进行8-连通域标记,以分割出相应的平面几何图形区域和标识字符区域。对于其中的平面几何图形区域,首先利用RANSAC圆检测方法对圆实体进行检测,并在检测后消除图像中圆实体的相关像素点,然后用渐进概率霍夫变换进行线段实体的检测,最后再通过大量的后期优化处理以保证更为鲁棒的检测效果,包括连通域标记优化、虚线的检测与恢复等,得到所有几何实体基于坐标系统的原始信息。第二部分是几何实体信息的抽取与表示部分,主要包括标识字符的OCR、实体信息抽取、实体信息表示三个步骤。其中对标识字符区域的OCR过程使用BP神经网络进行训练识别,并把对应的标识字符结果整合到离当前字符区域中心距离最近的点实体的属性信息中。同时,总结了平面几何图像中有效的实体信息类型,并给出了基于坐标系统的对应抽取方法。最后,根据所抽取到的实体信息使用谓词扩展表示形式、方程系统表示形式、自然语言表示形式三种方式进行一致化表示。本文最终形成了一个鲁棒的几何实体信息抽取与表示的统一框架,并在收集的图像数据集上进行了大量实验,对该框架的合理性与鲁棒性进行了验证。