基于深度学习的手绘草图生成、识别及应用研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:qwerasd1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在整个人类文明进程中,手绘草图一直用作一种直观的表达方式和基本的交流工具。随着电子设备的发展和触摸屏的普及,即智能手机、平板电脑、手写画板和智能手表的出现,草图可以通过手指滑动的方法更加方便地获取到。不同于传统的包含丰富颜色和纹理信息的图像,草图在视觉线索上更加稀疏且包含的细节更少,但是人们很容易识别出草图所属的目标类别,这表明人类对物体的神经视觉表征具有内在的稀疏性,因此稀疏的草图研究可以帮助我们更好地理解人类认知过程,同时促进高效视觉分类器的设计。此外,草图作为一种沟通和交流的方式,不同的人能够快速正确地识别出感兴趣的目标和内容,从而克服了文化、语言、时间和年龄的障碍。因此,手绘草图的研究可以促进人类知识和信息的传播以及情感的交流。本文以手绘草图为研究对象,深入研究了基于深度学习的图像识别技术在草图识别相关任务中的应用,其中包括草图生成和分类、基于草图的图像检索和行为识别等热点领域。草图识别是上述任务的核心基础,本文方法旨在得到更优的草图表征方式,从而能够准确、高效地实现草图识别的目的,因此本文对草图相关问题进行研究具有非常重要的理论意义和实用价值。本文主要的研究内容和成果如下:(1)针对目前草图训练集的缺乏和基于草图的图像检索准确率低及推广能力不足的问题,本文提出了基于多尺度策略的草图生成模型。首先,提出了多尺度的卷积神经网络生成粗略草图,利用多尺度和多层次学习提取图像的底层和高层特征,从而更充分地利用了不同层次的信息;然后,提出了基于粗略草图与修正模板匹配的图像细化方法,利用图像处理中的形态学操作,基于两步走策略并通过加权求和得到最终的细化草图;最后,提出了薄板样条插值策略,对细化的草图进行非刚性变形,以解决不同背景人员在绘制过程中的草图样式变化问题。实验结果表明,本文方法在公开数据集上取得了很好的草图生成效果,同时解决了基于草图的图像检索任务中的跨域检索问题。(2)针对目前大部分深度卷积神经网络在构建草图表征时,都将草图当做普通的纹理图像,而没有考虑形状信息对提取草图特征的重要作用,本文提出了一种基于双分支的草图特征提取网络。首先,利用传统的卷积神经网络提取原始草图的外观特征;然后,提出了基于草图轮廓关键点集的神经网络来提取草图的形状特征,该分支将草图的轮廓关键点集作为输入,引入仿射变换来解决神经网络对草图旋转和平移的不变性问题,同时采用最大池化来聚合所有点的信息解决草图采样点顺序的不变性问题;最后,提出将外观特征和形状特征融合,并对特征向量进行L1归一化实现草图分类器SVM的训练。实验结果表明,考虑草图在缺乏颜色和纹理信息的情况下引入轮廓点集表示,可以挖掘出更多隐含的形状特征,进一步提高草图识别和检索两大任务的准确率。(3)针对草图具有稀疏和抽象的结构特点,前面提出的方法都没有考虑草图局部特征提取对形状表征的影响问题,同时基于深度卷积神经网络的草图识别方法虽然能够提取外观特征和形状特征,但是忽略了不同特征之间的相互学习。本文提出了一种基于互学习的端到端手绘草图双分支网络。首先,提出了多层特征融合的卷积神经网络来提取草图的外观特征,利用多个浅层中间卷积层输出的特征与最后全连接层输出相结合,并使用全局平均池化保留显著特征、降低特征维度;然后,提出了基于图卷积的神经网络提取草图的形状特征,通过对每个采样点利用K近邻算法构建图,再利用图卷积网络提取局部特征来增强草图形状的表达能力;最后,提出了互学习策略同时优化两个识别网络,通过引入类别一致性损失和视觉注意一致性损失来约束两个分支。实验结果表明,该模型的识别性能优于现有方法,可以提高草图识别和基于草图的图像检索任务的准确率,并能通过微调模型的方式推广到其他风格的草图识别任务中。(4)针对目前很多基于不同模态的神经网络进行视频行为识别时,都没有考虑人的形状信息对识别准确率影响的问题,本文将草图特征应用到行为识别的预测任务中,提出了基于中层语义表示的卷积神经网络用于行为识别。首先,提出了一种注意力导向的草图生成模型,利用草图生成网络从动作视频中提取人的形状结构以生成原始草图,与此同时,使用注意力引导机制,对原始草图进行区域修正,去掉无关区域和噪音信息,从而生成与行为识别相关的判别性区域;然后,提出了基于原始草图和点表示草图的双分支神经网络模型,对视频关键帧进行选取并输入网络,分别提取纹理信息和点集表示的形状信息,从而实现基于视频草图的行为识别;最后,对多个模态的行为识别分数进行决策级融合,将融合后的结果作为最终的行为识别结果。实验结果表明,视频草图模态对行为识别起到了积极的作用,有效提升了系统预测的性能,降低了识别误差。
其他文献
在国内尚无成熟的高精度位置服务平台可供参考的背景下,针对湖北省BDS导航应用示范项目中海量终端与应用系统对高精度位置服务的具体需求,提出了一条适用于湖北省BDS导航应用示范项目的 BDS高精度位置服务平台建设思路,阐述了湖北省BDS高精度位置服务平台建设的总体目标,给出了平台业务体系架构和总体工作流程,并对组成平台的BDS高精度差分服务系统、位置服务开放系统、地图信息服务系统、运行监控系统和云基础
传统的等安全系数法套管柱设计基本思路是“套管受到的载荷×安全系数小于或等于套管的强度”,其核心是强度安全厚则,而较少考虑套管的成本。在现代钻井工程中,套管柱费用所
看到余秋雨先生写的博客,谈到以前古人读书之艰难。说"在书籍稀少,又缺乏流通机制、借阅机制和购销机制的时代,很多书生为了读一本书常常在雪天步行几十公里去轻叩某个据说藏
在均质气藏物质平衡方程的推导过程中,假设之一是气藏的储层物性和流体物性是均匀分布的,对于基质和裂缝具有相似的储集能力的裂缝气藏,这个假设不再成立,由于裂缝的压缩性比基质
我国西部深层气藏往往表现出异常高压的特征,油气藏生产时,由于地层压力下降导致储集层骨架变形和孔隙度、渗透率降低,该类气藏表现出很强的应力敏感性。该类气藏一方面渗透率随
非均质模型在实验研究中应用非常普遍,但由于无法求解非均质模型中不同区域的渗透率,给定量评价非均质程度以及深入研究采收率等重要参数带来困难。文章首先给出了井点呈对角分
一位好的语文教师,必须具备健康的个性品质,乐观,开朗,有自信,既能善待学生的过错,宽容学生的无知,理解学生的心情,又能发现学生的问题,纠正学生的缺点,端正学生的态度,从而愉快地完成教学任务。所以,我认为真正的语文教师不会违背生命成长最基本的规律;真正的语文教师不会让自己的学生感到自卑;真正的语文教师必是师爱无限,满腔热情,呵护学生心灵的教师;真正的语文教师必是专业过硬,引导学生健康发展的教师。一句
针对在野外GNSS作业中,手簿记录仍采用人工手写、观测资料整理不能自动化、数据检查效率低下的问题,研发出GNSS观测成果标准化系统,给出GNSS观测成果标准化系统电子化手簿记录技术、自动化观测资料整理技术、批量数据检查技术要点,阐述系统结构,并对系统部分功能进行探讨。运行结果表明,该系统可以辅助控制GNSS作业生产过程,提高观测资料的可靠性和成果质量。
以人为本的现代管理模式下,病案管理人员只有努力提高整体素质,才能创建和谐的病案环境,更好地服务于医教研及社会各阶层。
一些有名望的科学家和作家相信,在地球内部存在着不为人知的地下城镇,在这些城镇中,住着不同于人类的生命体……
期刊