论文部分内容阅读
在当前的人工智能+教育时代,如何利用人工智能发展智能导学技术成为一项研究热点。机器解答作为智能导学的一项基础技术,主要研究如何让机器自动对进行题目理解、推理及解答生成。就机器解答物理电路图而言,文本题目理解和电路图形理解是电路题目理解的两项基本内容。其中,电路图形理解是指识别图形中的电路元素(即电路元器件识别)并抽取电路图形所蕴含的解题知识。目前元器件识别研究中仍有不少问题需要解决。本文采用目前流行的深度学习方法,对不同应用场景部署元器件识别算法所遇到的以下问题进一步优化。一方面,在云服务的集中式识别应用场景下,基于通用深度学习框架的目标识别算法其电路元器件识别精度与实际应用需求具有一定差距,仍然有较大提升空间;另一方,在基于移动终端分布式识别场景下,目前的方法并未考虑设备算力受限、存储空间不足等轻量化部署要求。针对上述问题,本文面向物理电路元器件识别技术的实际部署需求,尝试引入深度学习方法,分别针对不同应用场景提出了两种元器件识别优化方案,并建立了一个初中物理电路图数据集验证方法的有效性。本文的具体研究工作如下:(1)构建面向大规模在线服务的电路图识别方法。本文基于深度学习算法,选取并比较了流行的卷积神经网络,针对以往算法中的特征提取网络结构过于复杂,损耗计算时间且不适用于简单图形识别任务的问题,提出了一种多路分组结构的新型特征提取网络ResNeXt28,通过对照实验,验证了本方法在电路识别任务上的精度指标优于传统方法,较大幅度提高了元器件识别算法精度。(2)设计面向移动终端应用的轻量化电路图识别方法。为了解决图像识别算法模型参数量过大,难以在移动终端直接部署的问题,本文在通用深度学习识别算法的基础上,借鉴了多种网络轻量化策略,对神经网络中的特征通道进行随机分裂与重组,提出了一种轻量化电路识别网络YSNet。实验结果表明,与流行图像识别算法对比,本文提出的YSNet大幅缩减算法模型参数同时保证了识别精度,在移动终端上部署具有明显优势。(3)建立面向机器解答的物理电路数据集。为了验证上述所提的两种电路识别方法,本文从初中课本、权威考试试卷中搜集了多张习题电路图,手工标记了电路符号的位置与标签分类,再将数据集适当扩增,建立了一个包含5500张物理电路图的数据集Pscs-5500。实验结果表明,本文提出的两种方法,分别针对特定部署场景,提高了电路习题图形的识别精度,减少了模型空间占用。研究成果可广泛应用于在线机器解答应用场景,提升智能导学的智能化程度。