基于深度神经网络和内容保留的自适应图像风格迁移算法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:onepiece_bing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能(Artificial Iintelligence)简称AI,它的发展不仅改变了人们的日常生活,同时也改造着生产和管理模式,它已渗入到现代社会的方方面面。从科学角度来讲,人工智能是研究和扩展人的智能的一门科学。人工智能在图像处理-图像风格迁移上的应用也越来越深入。图像内容以另一种图像样式进行呈现,称为图像风格迁移是深度学习中最有趣的应用之一。这就涉及到两方面的图片,一张风格图片(一般是名画)、内容图片(想画的内容)。把艺术大师的名画的风格迁移到普通的图片上,使用人工智能的机器也可以画名画。目前实现图像风格迁移效果的方法有以下几种。一是迭代优化的方法,迭代优化方法的速度很慢,速度限制了它的实际应用。二是利用前馈卷积方法,前馈卷积方法仅能实现一种或有限种类的样式。这限制了风格迁移方法的灵活性。三是任意图像内容任意样式的迁移方法,但是该方法在样式化图像中表现出块状效果。影响生成图像的质量效果。在本研究中,提出一种基于深度神经网络和内容保留的自适应图像风格迁移算法。所提出方法的核心是一个新颖的自适应转换层,通过训练自适应转换算子A,使得样式图像完成到内容图像的二阶统计转换,该层将内容特征的均值和协方差与样式特征的均值和协方差对齐。本文方法首先提出了 MaskShading模块,通过生成Mask的模式,解决在图像风格迁移过程中出现的图像内容细节丢失,边缘模糊的问题。此外还可以实现对指定的图像区域进行迁移变换。Mask将前景与背景分开,并将样式应用于指定的前景。通过实验,分析比较迭代优化方法、前馈卷积方法、任意样式迁移方法和所提出的方法进行的图像风格迁移生成的图像效果。实验结果表明,所提出的算法框架在速度、灵活性和质量方面实现了良好的折衷,并且优于现有方法。本文方法可以解决图像内容失真,轮廓细节模糊的问题,使内容丰富的图像可以得到精确的风格迁移。另外该方法允许使用单个前馈神经网络灵活地进行用户控制,例如内容风格的权衡,风格插值,颜色和空间的控制。
其他文献
虚拟现实室内场景应用的需求日益增长,人们对场景真实感不足、画面流畅度有限、使用易疲劳等影响用户体验的问题要求越来越苛刻。在虚拟现实所使用的绘制技术中,传统的PBR技
语音信息是人类交流中最重要的一种形式,但是在实际生活中语音信息会受背景声音的干扰而影响语音信息的准确性,进而影响人们的交流。语音信息作为人类交流的最重要手段,因此
稀疏表示和联合稀疏表示已成为模式识别领域中的主流技术,常被用来进行图像分类、恢复、去噪等诸多应用。传统的稀疏表示和联合稀疏表示通过一个过完备字典线性表示输入信号,
随着《中国制造2025》战略的提出,传统行业向智能制造转型已经成为一个趋势,工业智能化将是构成未来智能制造体系的关键所在。工业大数据技术是智能制造标准体系结构的关键技
由于全球老龄化的加重,近年来关于老年人跌倒的问题逐渐引起学术界的关注。老年人跌倒发生率高,而且后果比较严重,威胁着老年人的身心健康。老人的跌倒可以通过一定的手段来预防,高效且适用的跌倒检测算法可以很大程度上减轻由跌倒引起的危害。尽管目前有一些基于传感器,可穿戴设备和摄像头进行跌倒检测的方法,但它们都有一定的局限性。Wi-Fi信号由于成本低廉、在黑暗的条件下也可以使用、容易大规模部署等特点在跌倒检测
随着我国民主化进程加快,公民参与社会治理和公共决策的意识不断增强,参与的深度与广度也不断扩大。习近平总书记在党的十九大报告中指出“要创新社会治理,打造共建共治共享
在大口径望远镜发展中,为增大望远镜的光学口径,提高其分辨力,拼接镜片的主动光学技术应运而生,拼接镜片支撑机构的稳定性与调整精度是大口径拼接望远镜的核心技术之一。本文
随着信息可视化的发展,自然语言的可视化逐渐进入人们的视野。文景转换就是将自然语言描述的场景用图片或动画等形式进行展现的过程,其可能对文化交流、设计等多个领域的发展
人类社会方方面面都离不开数字加工。空间数字反应编码联合效应(spatial-numerical association of response codes effect,即SNARC效应)是数字加工的一个热门问题,它是指对于较大的数字,被试的右手会比左手反应更快,而对于较小的数字,被试的左手会比右手反应更快(Dehaene,Bossini,&Giraux,1993)。以往研究大多探讨的是目
文体分析在翻译中有着重要作用。分析原文文体,译者对原文的体裁、语言特征、写作风格的认识更加清晰明确,对原文的理解更加深入,才能选择合适的翻译策略,忠实、流畅地表达原