论文部分内容阅读
风格化是指用艺术手法对具体事物进行抽象表示,从而在阐述事物的同时强调某种特定的感情色彩或思想倾向。具体事物的载体可以是图像、文字或雕塑等,而风格化的技术方法也随之各异。随着人们生活水平的不断提高,图像风格化日益成为家庭生活或广告设计中不可或缺的技术方法,相比于写实照片,风格化图像能够更加强烈地传达出特定的情绪和意图,让人更加印象深刻。在过去,风格化图像一般由艺术家手绘而来,如毕加索、梵高、我国的吴冠中等,他们通过丰富的经验来将绘画的“景”与“意”融合,但这一工作也十分耗时耗力。近年来出现一种基于卷积神经网络的图像风格化方法,能够非常快速便捷地将指定风格迁移到目标内容图上。该方法生成的风格化图像虽然精美,但往往会抹除或改动内容图所要表达的语义信息,使生成的风格化图像失去实用意义。图像的语义是指图像所要传达给受众的主要信息,一般受多种因素影响,例如图像的显著性区域:处于此区域内的图像内容,包含了图像所要表达的主要信息;如果将图像上此区域内容扭曲或覆盖,可能会导致图像被无法被理解或被误解。为了充分发挥基于神经网络的图像风格化方法的优势,同时使风格化结果尽量表达出与目标内容图一致的语义信息,本文主要开展了如下工作。本文提出了一种能够保持图像显著性区域的风格化方法,通过设计一种新的损失函数来监督生成风格化图像中显著性区域的改变,再将其与基于卷积神经网络的图像风格化方法进行结合,从而保持生成风格化图像的显著性区域与目标内容图相同。实验结果表明,本方法所生成的风格化图像,不仅较好地融合了所指定的艺术风格,还能准确表达出目标内容图的主要语义信息,从而具备更高的实用价值。此外,通过对多种典型的保持语义信息的图像风格化方法进行分析研究,并探索他们的优缺点和共性,我们发现这些方法虽然在各自关注的语义因素上表现良好,但却无法做到融合各家所长,导致在某些情况下风格化结果无法尽如人意。于是我们提出了一个能够同时保持多种语义因素的图像风格化方法。该方法可灵活地将某一种新的语义因素估计方法融合添加到系统框架中,从而估计风格化结果在该种语义因素上的偏差程度,再通过训练优化,便能得到一个能够同时保持多种语义因素的图像风格化模型。