基于图像数据的卷积神经网络滤波器可视分析方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:g10703107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在很多领域都取得了显著的成功,尤其是在图像识别领域,其准确率已十分接近甚至超过相关专家的水平。然而,卷积神经网络的工作机制至今仍然没有一个合理严谨的解释,它对专家而言仍是一个让人无法理解的“黑盒子”。训练出一个好的模型往往是一个反复试验的过程,这需要耗费大量的时间和计算机资源。为了加速训练过程,减少试验次数,专家需要了解训练过程中发生了什么,然而现在主流的机器学习框架虽然提供了可视化工具帮助用户分析,但只提供很少的一部分信息,并且无法进一步探索,这远远无法满足部分专家的分析需求。卷积神经网络通常是由几十层甚至上百层的隐含层组成,而每一层隐含层是由几十个乃至几百个滤波器构成。即便卷积神经网络具有共享权重的特性,但是其内部独立的权重参数仍然有几十万乃至上百万之多,而随着迭代的进行这其中的权重参数也会随时进行更新,单纯的观察数值无异于天方夜谭。可视分析是辅助用户理解这类复杂的数值问题的有效手段,相较于传统的数值分析方法,不仅更加直观易懂,而且对用户的专业性要求也更低。通过建立多层次探索交互的可视化分析框架,帮助用户探索卷积神经网络中滤波器的演变规律,理解各个隐含层中滤波器在卷积神经网络中扮演的角色,辅助用户找到卷积神经网络在训练过程中出现的异常现象,并分析其产生原因,从而进一步优化网络结构参数并调整训练方法。本文提出一种通过评价卷积神经网络各个层级的训练质量来高效探索卷积神经网络隐含层的方法,并引入可视化技术对卷积神经网络训练日志数据进行多层级的深入分析。本文主要的研究内容和贡献如下:提出从网络层到隐含层,从隐含层到滤波器的可视化探索流程,设计多个直观易懂并具有丰富视觉编码的视图,帮助分析人员直观高效地发现训练过程中产生的异常情况并能进一步探索其异常产生的原因。研究卷积神经网络隐含层的评价方法,考虑到卷积神经网络中滤波器能够独立识别特征的数量是衡量该层隐含层识别特征模式能力的重要指标,通过统计计算滤波器的困惑度频数分布来评价隐含层的训练质量。研究滤波器的多维度可视感知方法,多视角展示用户感兴趣的滤波器,通过分析比较不同滤波器间的距离,设计多个可视化视图辅助用户快速定位发现异常滤波器。设计并开发了一个集成的可视分析系统,通过多层级可视化视图、丰富的多图联动技术能在优化网络结构,辅助参数设置,探索异常原因等方面为用户提供指导。
其他文献
行人跟踪是计算机视觉领域的一个研究热点,在智能监控、自动驾驶和人机交互等领域都有着广阔的应用前景,其中目标与背景相似导致跟踪精度低是目前跟踪算法研究的一个重点。近
神经网络技术在图像识别,数据挖掘、计算机视觉等领域得到了广泛的应用,随着要处理的数据越来越多,网络结构越来越复杂,从而需要消耗大量的计算资源。为了保证神经网络推断过
我国农业发展正在处于现代化转型期,农业从业人员心理行为随着市场经济发展深入而发生转变,但心理行为从传统到现代转化过程并不是全部符合市场经济发展的。农业从业人员心理
随着国内智能制造技术的发展,数控机床依靠其高效率和高精度的性能优势,正在逐渐取代传统加工设备。加工工艺与机床夹具是工件加工过程中的重要组成部分,对于保证工件加工精
β-硝基苯乙烯是一类重要的有机合成中间体,被广泛应用于合成各类生物活性分子,药物以及有机合成中间体。其分子结构中的强吸电子基团硝基,使得烯烃电子云发生极化,能够发生
在实际生活中,除同质总体数据外,还存在大量异质总体数据,对于这些数据来说,混合回归模型是重要的统计分析工具之一,并且被广泛应用于生物、医学、经济、金融、环境保护、工业设计等领域。混合专家回归模型在混合回归模型的基础上对混合比例建模,进一步对异质总体数据进行分类、聚类及回归分析。变量选择是统计分析与推断中的重要内容,也是当今研究的热点课题。针对混合回归模型,目前研究较多的是对其参数进行估计,而对变量
僵尸网络已经成为网络安全领域非常严重的威胁,它被证明有能力感染数十亿计算机并驱使它们进行非法活动,给社会带来了巨大的经济损失。对僵尸网络的有效检测有望缓解这一现象
最小加权独立支配集问题(MWIDS)是独立支配集问题的一个重要分支,在独立支配集问题的基础上增加了权值的约束,同样也增加了问题的难度。MWIDS问题已被证明是NP难组合优化问题
随着《公共文化服务保障法》的颁布实施,提供公共文化服务已成为我国各级电视台的法定职责。然而在实践中,地方电视台如何履行公共文化服务职能?地方电视台发起的公共文化服
人脸表情识别和车辆属性识别是图像识别的两个重要应用,人脸表情识别和其它图像识别如人脸识别主要的流程和方式很类似,但有其特殊性,其特殊性在于判断一张人脸的表情主要是