基于生成对抗网络的图像场景转换算法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:liboliang1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的场景转换,在工程领域应用前景深远。因此,本文将基于生成对抗网络进行图像场景转换作为研究对象。本文详述图像处理的相关概念和分类,并讨论生成对抗网络的基本原理及模型,引出本文的研究内容。本文研究主要包括两部分,一是基于生成对抗网络的雾霾图像转换算法,二是基于生成对抗网络的图像场景转换算法。本文针对基于条件GAN的图像转换算法进行雾霾场景转换,会出现明显块效应的问题提出改进。改进优化后的基于生成对抗网络的雾霾图像转换算法从主客观结果证明该算法进行图像加雾和图像去雾效果明显,且能够消除块效应。因此,在此研究基础上,为了实现多种不同场景转换,本文又提出基于生成对抗网络的图像场景转换算法。具体贡献如下:1.在基于生成对抗网络的雾霾图像转换算法中,修改判决器网络,使用全域卷积判决器替代patch GAN;调整损失函数中L1损失的参数,并选择迭代次数最优值,设置合适的判决器层数,得到优化的网络模型。2.在基于生成对抗网络的图像场景转换算法中,设计新的生成器网络结构。主要采用带跨层连接结构的深度卷积。通过跨层连接实现底层卷积与顶层卷积的信息共享,更好地保留了图像的内容结构,使输出图像与输入图像的结构和边缘保持一致。3.设计多尺度判决器网络结构,分别对图像的不同尺度进行判决。当判决器的输入图像为大尺度时关注图像的细节,小尺度时关注图像的结构。将大小尺度相结合,能够在判决时兼顾图像的细节和结构。4.提出了新的损失函数。在基于生成对抗网络的雾霾图像转换算法的损失函数GAN损失和L1损失基础上,加入VGG损失和特征匹配FM损失,以利用VGG网络和判决器网络增加对生成对抗网络的控制,使生成图像与目标图像更加接近。最后,本文算法在多种转换下进行主客观分析,包括:图像加雾、可见光图像转换SAR图像、卫星图像转换地图图像、白天转换黑夜图像。对比其他相关算法,本文算法能够进行多种转换,且生成图像更加真实,细节保留完整,能明显消除块效应,对景物边缘保持较好,线条更为流畅。
其他文献
学位
电力机车负载作为单相负荷,给电力系统带来了严重的谐波、负序、电压波动等问题,严重影响了电网的电能质量和安全稳定运行。市域铁路作为电气化铁路的一种,属于短距离运营,中心城区土地资源紧张牵引变电所选址上有一定困难,而且当动车段所与牵引变电所距离较远时,投资较大。所以拟研究采用市电10k V或35k V作为进线电源对动车段所供电的可行性,包括对10k V(35k V)升压牵引变电所的工程实施方案进行研究
目的:探讨解郁化痰中药对慢性不可预知应激下ApoE-/-小鼠血脂代谢、 下丘脑-垂体-肾上腺轴(The hypothalamic–pituitary–adrenal axis ,HPA axis)应激激素及海马脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)表达的影响。方法:选用雄性C57Bl6和ApoE-/-小鼠随机分为A:空白对照组、B:AS模
从哲学的角度上来说,康有为的道器观应属于一种道器分离的经验论哲学,理欲观则是表明其元气自然人性论,公私观和王道天下思想则在政治哲学意义上表明康有为非常重视集体(“群”、“公”)的地位和作用。从康有为与传统哲学之关系角度上来看,他是明清、乾嘉以来哲学发展在清末民初的继续展开,表现出中国现代价值观的进一步生成,并与西方一些价值观念结合起来。在总体精神倾向上,康有为的哲学朝向更为彻底的人道主义。以上两点
世纪之交的九十年代,中国文化领域内部出现急剧分化的态势,多元文化交织发展。互联网的影响更是加剧了这一变化,网络语言、网络热词、网络文化等以星火燎原之势席卷而来,让人措手不及。很快,它们就成为了人们日常生活中的一部分,并记录下了人们的文化心理特征。作为一种方便快捷的表达方式,网络语言和常规语言相比,具有新奇、简约、时尚和幽默的表达效果,诸如“囧、槑、屌”等这些已经在人们日常生活用语中消失了很久的生僻
随着电力系统规模的日益发展,人们对输电线路的安全运行提出了更高的要求。同时,随着我国森林覆盖率及人们环保意识的不断提高,高压输电线路走廊树枝已经成为了输电线路安全运行的重要隐患之一。目前树枝修剪采用的主要措施是工人爬树修剪或者相关作业车辆辅助人工修剪,这两种方式劳动强度大,风险高。另外,对于在车辆难以进入的原始森林甚至会因砍伐树木,引发相关社会与法律纠纷。故修剪线路走廊树枝日益成为一个电力安全作业
随着CT(Computed Tomography)技术的不断发展,CT成像在医学领域已被广泛应用于多种疾病的检查。然而,在CT成像的过程中,图像的质量可能会因为各种原因而出现下降。因此,对于CT图像进行去噪和超分辨率处理具有重要意义。本文首先回顾了CT成像技术的发展历史与基本原理,分析了CT成像过程中的主要噪声来源以及制约成像分辨率的主要因素,并且对现有的CT图像去噪与超分辨率方法进行了讨论。然后
在智能驾驶的过渡期,为获取更自然的人车交互方式,人们把目光转向了以具身认知为基础的多感官交互。眼控交互因其自然的交互方式、高带宽的信息输入与准确的认知匹配特性逐渐得到应用。眼控交互与AR-HUD的结合能够兼容眼控交互的特性,释放眼控交互的潜能。本研究主要做了以下三方面的工作:首先,进行相关的理论梳理,分析具身认知理论下,眼睛的生理构造与眼部动作分类,并研究眼控交互的特征与应用现状。研究后提出以驾驶
随着社会经济和互联网经济的高速发展,人们已经进入多媒体时代,信息的传递不再局限于文本模式。传统的以文本为研究对象的话语分析方法忽略了非文本符号的表现形式,多模态话语分析应运而生,逐渐成为语言学家讨论的热门话题。人们逐渐清晰地认识到语篇的意义不完全是由语言本身决定,还应该通过非语言模态,如手势、色彩、表情、讲话者和听话者共知的事物等来体现,共同整合表达意义。克勒斯和范勒文以韩礼德的系统功能语法为基础
地塞米松在临床上广泛用于具有早产风险的孕妇,可有效预防和(或)治疗早产儿的支气管肺发育不良。然而,孕期使用地塞米松具有“双刃剑”效应。流行病学和动物实验表明,孕期地塞米松暴露(prenatal dexamethasone exposure,PDE)不仅会导致子代低出生体重、同时还会诱发多器官发育毒性及成年后多种代谢性疾病易感性增加,其中包括胰腺功能异常和糖耐量减弱。胰腺是机体唯一分泌降血糖激素胰岛