【摘 要】
:
随着科技和媒体近几十年来的飞速发展,网络上和我们的生活中随处可见丰富的文本图像。这些文本图像拥有不同的字效,并且位于各个不同的场景之中。生成对抗网络(Generative Adversarial Network,GAN)和基于像素到像素的风格迁移方法的发展加速了文本图像编辑方法的研究,研究对象包括场景文本图像和独立文本图像。由于场景文本图像编辑具有较高的难度,因此当前的场景文本图像的编辑方法对具有
论文部分内容阅读
随着科技和媒体近几十年来的飞速发展,网络上和我们的生活中随处可见丰富的文本图像。这些文本图像拥有不同的字效,并且位于各个不同的场景之中。生成对抗网络(Generative Adversarial Network,GAN)和基于像素到像素的风格迁移方法的发展加速了文本图像编辑方法的研究,研究对象包括场景文本图像和独立文本图像。由于场景文本图像编辑具有较高的难度,因此当前的场景文本图像的编辑方法对具有复杂字效的场景文本图像不能起到很好的效果。图像、视频中的文本图像被称为场景文本图像,它们包含丰富的语义并在许多多媒体应用程序中起到非常重要的作用。本文致力于研究针对场景文本图像的文本图像编辑方法,最终目标是能编辑场景文本图像中的文本内容而无需破坏整张图片的整体外观。无论是在学术界还是工业界,场景文本图像编辑任务引起了越来越多的关注,并且受到许多实际应用的驱动,例如文本图像合成、海报的文本图像编辑、文本图像校正、增强现实等。场景文本图像编辑面临两个主要挑战,分别为文本风格迁移和背景纹理保留。本文基于Truetype字体协议设计了具有丰富字效的场景文本图像数据集,为场景文本图像编辑任务提供了丰富的训练样本。本文提出了用于表达文本图像结构特征的三通道Mask图像作为辅助信息,更强力地约束文本图像的结构特征,并给予文本风格迁移更有效地监督。依托本文提出的三通道Mask图像,本文提出了具有高鲁棒性的文本图像编辑方法Mask-Guided GAN;该方法通过将文本图像编辑任务分解为六个子任务并设计了相应的子模块,增强了文本图像编辑的可解释性,使研究者可以细致地观察文本风格迁移的过程,从而能针对性地对文本图像编辑的模型进行优化。本文提出了场景文本图像的文本背景分离任务并用本文设计的算法起到了良好的效果。本文的实验部分采用图像效果实验、量化评估实验和人工打分评测实验这三种评估方法将本文提出的方法与前沿方法进行对比,同时对本文提出的方法进行消融实验,实验结果均证明了本方法的有效性和优越性。
其他文献
近年来,随着全球环境问题的日益突出,人们越来越重视绿色低碳环保材料的研究及应用。传统的纤维吸声材料主要由玻璃纤维、矿物纤维、聚酯纤维等制备而成,这些材料有的难以降解,有的甚至会影响人类的健康,带来严重的经济损失。面对新型可降解吸声材料的需求,植物纤维作为产量高、绿色可降解的原料,逐渐成为当下新型吸声材料的研究热点。虽然植物纤维制备的吸声材料吸声性能和传统吸声材料相当,但是由于纤维本身特性,存在着阻
随着无线通信系统的日益发展,尤其是随着5G时代的到来,毫米波频段的发展与应用备受研究与关注。因此,对无线系统的关键器件天线也提出了更高的要求。毫米波端射天线在机载、车载通信系统、雷达系统以及点对点通信系统等方面有着广阔的应用。为了满足端射天线愈来愈高的指标要求,本文对5G毫米波频段(24.25-29.5GHz)的线极化和圆极化端射天线进行研究与设计,基于提出的印刷磁偶极子引向器提高端射增益,实现的
石英玻璃/陶瓷具有众多优良性能,被广泛应用于光学元件、微波基片和耐火材料等领域,但其制备方法仍存在成本高、工艺复杂或不适合精密制造等问题。硅溶胶为纳米二氧化硅在水中的分散液,具有良好的粘结和吸附特性,是有效的成型剂和助烧剂,而且工艺成熟、价格低廉,被广泛用于精密铸造等领域。本文以St(?)ber法及硅溶胶喷雾法合成了不同粒径的球形SiO2,以硅溶胶为原料或粘结剂制备了石英玻璃或陶瓷,并研究了相关石
本文基于钨材料特性和高离化等离子体辅助涂层(High Ionization Plasma Assisted Coating,简称HIPAC)技术优势,以集成电路金属互连、关键零部件表面强化和质子交换膜燃料电池(Proton Exchange Membrane Fuel Cells,简称PEMFC)金属双极板防护为应用背景,对HIPAC溅镀宽厚域纳米晶W和N掺杂W薄膜结构与性能进行系统研究。首先,探
我国的城乡规划正处于增量规划转向存量规划进程,旧村庄等低效存量用地的再开发成为城镇高质量发展的重要抓手。通过合理的方式推进低效旧村庄更新改造,提升其空间品质、注入产业活力,改善生活水平,是实现“城乡统筹、城乡一体、节约集约发展”的新型城镇化的重要内容。广东省是“三旧”改造试点省,其旧村庄改造走在我国前列。然而,旧村庄改造由于涉及利益者众多、改造审批流程繁琐、政策限制较严等原因,一直难以广泛开展。旧
随着人们生活层次的提升,越来越多的人更加重视身体健康状况,对于日常防护和检测的智慧型医疗产品的依赖逐渐增加。心率作为反映人体健康状况最重要指标之一,如何方便、快捷、准确地测量心率值,是当前的一项研究热点。传统的心率测量方式存在过程繁琐、仪器昂贵、直接皮肤接触等诸多短板,针对存在的问题,本文研究一种基于成像式光电容积脉搏描记法的心率测量方式,并结合活体识别与人脸识别技术,能够在无接触的情况下,快速准
随着物联网的快速发展,未来无线网络中的移动设备数量将快速增长,这不可避免地导致海量数据和计算并且需要很高的资源消耗。边缘计算(MEC)被广泛认为是解决这些问题的核心技术。边缘计算通过将计算密集型任务从移动设备转移到网络边缘来实现实时信息传输和计算。由于在实际应用中存在无线和计算资源有限等诸多限制,所以,在边缘计算系统的数据传输和处理中,正确的计算迁移策略和有效的资源分配方法可以提高系统的性能。这是
数字低压差稳压器(Digital Low Dropout Regulator,DLDO)在亚阈值电压下可以稳定地工作,而且基本由可综合的数字电路构成,同时具备良好的工艺伸缩性。其各种优点能够在功耗、面积上有效地弥补传统模拟低压差稳压器的不足,因此获得了越来越多的关注。然而,由于数字电路的功耗与其采样时钟频率成正比,多数时候为了降低功耗而使用较慢的时钟,当DLDO经历较快的负载电流跳变时,系统不能快
随着全球变暖、环境污染等问题的不断加剧,应对气候变化的行动和对资源环境的约束不断加强,开发清洁和可再生的能源势在必行。氢能因其具有能量密度高、可储存、可再生、零排放、零污染等特点,被认为是人类的终极能源。氢能来源多样,不同制氢方式的能耗、经济性及环境影响各不相同。本文针对何种制氢方式最适合现阶段规模化、低成本获取氢源这一关键问题,基于对各制氢方式的研究和分析,选取出三种主流的及具备竞争优势的制氢工
针对数据生命周期即存储、传输及使用过程中的数据,特别是敏感数据的保护,提出使用机密计算来保护数据安全。