论文部分内容阅读
近年来人工智能技术得到了快速发展,深度学习作为人工智能研究领域的一个重要方法,在人脸识别、图像分类等方面取得了许多突破性的进展,但同时面临着模型结构复杂、参数量级高、测试数据量大等难题,在一定程度上限制了深度学习方法的快速推广。深度学习的可视化技术能够提升神经网络的可读性,简化网络的理解过程,可以加快深度学习领域的研究进展,然而现有的可视化技术只能实现网络结构的图形化,存在功能单一、框架依赖度高等缺点,使得深度学习算法研究的有效性受到抑制。为了有效提升深度学习算法研究的快速性和便捷性,论文在探索网络模型训练与分析的可视化方案基础上,提出了一种针对Caffe深度学习架构的网络编辑与模型训练分析的可视化解决方案CaffePanel。论文主要工作有以下几点:(1)独创地设计了Caffe框架在Web平台上的网络解析与图形化编辑模型,融合模板语法特性与虚拟文档思想优化图形化速度,提出高速Caffe网络可视化与编辑机制;(2)结合前后端交互技术形成了可视化、可监控的Caffe网络训练调试机制,针对网络训练过程中的收敛性进行研究,设计了一种网络隐藏层的收敛性评估算法;(3)CaffePanel方案的设计与实现,主要功能模块包括Caffe网络模型解析与恢复,网络模型快速图形化和编辑模块,Caffe网络训练、预测、监控模块等。此外,从资源压缩、资源下载、文档阻塞等方面对CaffePanel的整体加载时间进行了优化。论文在CaffePanel平台上进行了功能和性能测试实验,实验结果如下:(1)在功能上,相较于同类应用,实现了网络层的图形化编辑与模型的训练,在网络编辑上具有更高的便捷性,并且通过网络训练与模型分析的可视化,训练过程更为直观可视,测试结果表明该平台各项功能符合设计要求并能稳定运行;(2)在性能上,测试结果表明CaffePanel方案实现的图形化机制较同类应用在速度上提升了17.9%,100层以下模型的图形化时间小于1000ms,方案整体加载时间小于500ms。由此可以证明,CaffePanel方案能够有效提高深度学习模型的开发效率,对深度学习技术的快速发展具有重要意义。