基于生成对抗网络的图像不平衡数据扩充研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ialyialyialy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类别不平衡数据分类问题是机器学习领域中的常见问题。为了缓解类别不平衡问题带来的负面影响,一种常用的方法是对不平衡数据集中的少数类样本进行有效扩充。目前已有多种经典的上采样方法应用于少数类样本的扩充过程,但这些方法主要针对低维数据,面对图像等高维结构类数据则收效甚微。生成对抗网络(Generative Adversarial Nets,GANs)是一种基于纳什均衡理论的新型深度神经网络。GANs由生成器和判别器两部分组成,其中生成器的作用是对先验噪声分布进行随机采样,通过网络的强大拟合能力生成与原数据相似的人工样本;判别器的作用是对真实数据和人工样本进行真假性分类,并将分类误差通过反向传播算法指导生成器的生成过程。GANs通过生成器和判别器的博弈训练,能够有效提取真实数据的深度信息并进行拟合,生成与原数据十分相似的人工样本,并可以用于图像扩充及分类过程。然而GANs存在着一个缺点:GANs在训练过程中会出现模式崩溃现象,即GAN生成的结果往往集中在某类或者某几类,生成结果的多样性较低,生成质量不高。本文从不平衡图像数据扩充需求出发,针对生成对抗网络存在的问题,提出了一种基于局部切空间的生成对抗网络(Local Tangent Generative Adversarial Network,LT-GAN)算法,用于图像数据尤其是不平衡图像数据的扩充过程。本文的主要贡献如下:1、使用自编码器网络获得原始图像数据的本质流形空间,减少了原始图像数据的噪声特征和冗余特征。2、提出基于局部切空间的生成器,在数据流形空间基础上,引入标签信息,通过切向量对数据进行局部特征采样,生成新样本。3、提出双功能判别器,适用于不平衡图像数据的分类过程,用以指导生成器对特定类别样本的生成过程。本文对提出的LT-GAN算法进行了详细的理论分析,并与现有的不平衡学习算法和生成对抗网络方法,在7个图像数据集上进行了对比实验,包括消融实验、图像生成实验以及将算法应用于不平衡图像数据的扩充实验。实验结果表明本文提出的方法具有一定的鲁棒性,避免了模式崩溃现象的出现,生成结果具有一定的多样性,并能对不平衡的图像数据进行有效扩充。
其他文献
基于半导体材料的可见光催化技术被公认为是有效解决环境水污染问题和能源危机的最有前途的技术之一。窄带隙p型半导体氧化亚铜(Cu2O)的理论太阳能转化效率可达14%-20%,易被太阳光谱中的可见光波段激发,并且其自然丰度高,价格低廉以及毒性低等特性使其在可见光催化领域得到广泛的研究和关注。但其价带位置和氧化还原电势决定了Cu2O在水和光照环境下具有严重光生载流子表面重组以及自身光腐蚀的固有缺陷,这将严
随着电子产业的发展,人们对电磁屏蔽技术的要求日益增加,兼具高导电性和轻薄的电磁屏蔽新材料成为了该领域的研究热点。碳材料具有导电性优异、低密度、化学稳定性高和成本低等优点,在电磁屏蔽领域具有巨大应用潜力。其中,具有优异导电性能和比表面积高的石墨烯是制备碳基电磁屏蔽材料理想的组分。但石墨烯存在易团聚、结构易坍塌等问题,难以发挥其在材料中的电磁屏蔽性能。木质素是储量丰富的天然芳香聚合物,是具有三维网络结
随着网约车行业的发展壮大,网约车逐渐融入人们出行的日常方式中,但由于网约车司机素质参差不齐、平台把关存在漏洞、场景复杂不受控等问题影响,广大群众越来越关注网约车出行的安全问题。在车载场景下应用人脸识别技术可以监督、规范网约车司机。但是,目前已较为成熟的二维人脸识别技术的使用场景大多都是受控的,而且二维人脸识别存在安全性不足的问题,这些问题成为了人脸识别发展的瓶颈。本课题来源于广州市某企业的科技项目
在能源转型的当下,电动汽车、共享出行和自动驾驶等出行升级正日益影响道路交通的能源结构。电动汽车作为一种新型交通工具,具备接入电力系统的条件,与其相关的应用研究在国内外得到广泛关注。对于这些应用研究而言,充电数据是其重要的研究基础,而当下的电动汽车渗透率和充电设施普及率依旧很低,与未来出行升级背景下的交通场景存在较大差距,无法在当前的实际场景中直接获得可用于研究的大规模电动汽车群充电数据。为此,本文
室温硫化(RTV)硅橡胶具有优异的电绝缘、耐臭氧老化、耐候、耐辐射等性能,已在电力行业得到越来越广泛的应用?为了更好地安全应用在高压绝缘领域,硅橡胶不仅需要有优异的力学性能,还要求具有较低的密度和良好的阻燃性能。本论文以空心玻璃微珠(HGM)为减重填料,三聚氰胺-氰尿酸盐(MCA)和聚四氟乙烯(PTFE)为阻燃剂,加入到气相白炭黑和甲基MQ树脂补强的以α,ω-二羟基聚硅氧烷为基础聚合物的RTV硅橡
近年来,图像生成,图像编辑,表征学习等计算机视觉任务在生成对抗网络的帮助下取得了飞快发展。其中,这些任务能够取得进展的主要原因在于生成对抗网络的关键部分——对抗损失函数。目前,该损失函数被广泛应用在无监督任务中。此外,对于生成对抗网络,其优秀的图像生成特性也为数据增广任务提供了新思路。本文将从图片像素化和图片反光去除两个任务出发,探索生成对抗网络在无监督训练和数据增广这两方面的优越性。图片像素化任
随着环保意识和可持续发展理念深入人心,生物质资源凭借着其可再生和易降解的特点受到了极大的关注。然而,许多工业生产中的生物质由于没有得到合理的利用,反而被视为废弃物,为经济发展和环境保护造成很大的负担。咖啡渣,作为咖啡工业的副产物,每年的产量达到数百万吨规模。然而现在咖啡渣通常被就地填埋或是燃烧处理,这种处理方式造成了资源极大的浪费并且引发了严重的环境污染问题。根据研究表明咖啡渣中含有纤维素,半纤维
近年来,即时定位与建图(Simultaneous Localization and Mapping,SLAM)技术逐渐成为室内导航领域中的热点。而大多数的视觉SLAM系统前端是基于点特征匹配,因此在弱纹理区域、光照变化或帧间运动过大的室内场景中由于无法提取足够的点特征导致匹配失败。然而在室内等人造场景中,存在大量的线特征可供提取,可与点特征形成互补。另外,视觉SLAM系统在帧间运动过快时存在位姿漂
Deepfake换脸技术利用生成式对抗网络(Generative Adversarial Networks,GAN)学习目标视频中人脸的深层次特征,能较好地将目标人脸替换为源视频人脸,且能同步人脸表情及说话的口型。Deepfake技术迅速发展,许多Deepfake假脸视频在网络上被广泛传播,对执法、社会稳定、公共安全等领域造成危害。因此,Deepfake假脸视频检测技术的研究具有重要价值。目前,有
莲子心(Plumula Nelumbinis)为睡莲科(Nymphaeaceae)莲属植物莲(Nelumbo nucifera Gaertn.)的成熟种子中间的绿色幼叶及胚根,莲子心味苦、归心、肾经是我国传统中药之一。莲子心具有多重的营养价值,莲子心多糖作为主要活性成分之一,具有较好的抗氧化、抗炎、降血糖以及调节糖脂代谢等功能。目前,对莲子心多糖的研究主要集中在莲子心粗多糖,缺乏对纯的莲子心多糖结