【摘 要】
:
训练深度神经网络通常需要大量带有标签的数据,在实际应用中成本高昂。通过利用从无标签数据中学习的隐藏结构以减少甚至完全移除标签,半监督学习和无监督学习已经引起了人们的广泛关注。这些方法的关键在于如何从无标签数据中自动提取抽象的特征表示,以提升模型的鲁棒性能。当前半监督学习和无监督学习方法呈现低一致性、数据增强单一、辅助任务不合理等特点,模型的设计仍需要进一步探索。本文的主要工作和创新总结如下:(1)
论文部分内容阅读
训练深度神经网络通常需要大量带有标签的数据,在实际应用中成本高昂。通过利用从无标签数据中学习的隐藏结构以减少甚至完全移除标签,半监督学习和无监督学习已经引起了人们的广泛关注。这些方法的关键在于如何从无标签数据中自动提取抽象的特征表示,以提升模型的鲁棒性能。当前半监督学习和无监督学习方法呈现低一致性、数据增强单一、辅助任务不合理等特点,模型的设计仍需要进一步探索。本文的主要工作和创新总结如下:(1)提出了一个基于互信息最大化与数据增强的半监督多重匹配识别模型Multi-Match。该模型包含一个简单增强分支和一个复杂增强分支。为保证信息的一致性,在简单增强分支中引入了一项互信息损失,不仅可以最大化输入和输出表示之间的互信息,还能最大化输出间的互信息。此外,针对现有信息移除方法区域性设计的不合理,提出了一种高效的信息移除方法CutEdge,并将其运用到复杂增强分支中来扩充数据增强方式。该方法以一定概率移除输入边缘处的多个区域,从而确保对目标进行部分移除。最后,模型还添加了一项一致性损失使复杂增强分支的输出接近于简单增强分支的输出,进一步提升了半监督图像识别模型的鲁棒性。实验结果表明,在不同标签比例的CIFAR-10、CIFAR-100和SVHN数据集上,该模型能够有效地提高识别准确率,减少了对标签数据的依赖。(2)提出了一个基于扰动一致性与互信息正则化的半监督一致性分割模型SCSeg。半监督识别任务成功的关键在于向无标签数据的低密度区域添加扰动,确保输出的一致性。相似的思路可以运用到半监督分割任务中。之前的方法已经证明了在分割任务中数据的低密度区域出现在编码器输出的特征中,然而现有方法仅为编码特征添加单一的扰动。模型优化了扰动的添加方式,即在每次参数更新时为编码特征添加不同类型的扰动,使扰动特征和未扰动特征的解码输出保持一致。此外,为解决像素级的一致性损失无法度量像素间存在的空间关系,模型还引入了一项区域互信息损失。通过最大化无标签数据的模型预测与其伪标签相邻区域的互信息,从而使模型能同时关注区域级和像素级的一致性,进一步提高一致性正则化效果。实验结果表明,在不同标签比例的Pascal VOC 2012和Cityscapes数据集上,该模型能够获得更高的平均交并比和更清晰的分割边界。(3)提出了一个基于预训练检测网络与无监督学习的目标位置分割模型OLSeg。图像分割的标注既昂贵又耗时,而目标检测任务通常更容易获取有标签的训练数据。因此,结合预训练检测网络和无监督学习进行图像分割,能有效地避免使用分割标签。通过设计一个基于视频中目标实例稀疏分解的辅助任务,利用图像实例的稀疏性和视频的帧间结构来获得目标的分割图。为提高识别“正确”目标的准确性,使用一个预训练的目标检测网络来提供目标实例的位置信息。分割模型通过在视频数据中训练,能够获得单张图像的前景、背景和分割图。模型性能的提升得益于目标实例的稀疏性(前景和背景)和位置信息(边界框先验),为输入提供了全面且鲁棒的视觉表示。实验结果表明,在YouTube Objects、Internet和MSRC数据集上,该模型能有效地提高分割性能,获得更清晰的分割边界。
其他文献
隧道全断面岩石掘进机(Tunnel Boring Machine,TBM)以其高掘进效率、对岩体扰动小、成洞质量高、安全性强等优势,已成为隧道与地下工程施工主要装备。然而,现阶段TBM掘进难以准确、快速地获取沿线岩体地质参数,TBM掘进控制参数的选择和掘进姿态的调整缺乏科学依据,主要依靠人为经验,时常出现TBM控制参数与岩体条件不匹配、不适应的问题,进而导致掘进速度下降、掘进成本增加、刀具出现异常
水,覆盖地球表面71%的物质,被称为生命之源。在世界上21个贫水和缺水的国家中,中国位列其一。国民经济发展与居民生活用水一直伴随着城市化的进程而不断发展。流域作为人类生存发展的聚集地,在单一生态属性的基础上增加了环境属性。淡水资源过度开采、水体环境污染是流域水环境管理中面临的两个主要问题。目前,点源污染在我国已得到广泛控制,而环境污染的主要源头已向面源污染问题转化。在从农业大国向农业强国的推进过程
随着能源与环境危机的日益加剧,超级电容器以充放电速度快、功率密度高、循环稳定性好等优点受到了广泛的关注。炭材料具有绿色环保、来源广泛、成本低廉等优点,已经被广泛用作电极材料,但是其低能量密度严重阻碍了实际应用。因此,有必要深入探究炭材料的形成和掺杂机理,并进一步优化其电化学性能。本文选择了多种前驱体、通过不同的方法制备了多种炭材料,探究了生物质组分、碳链结构和异质原子官能团对炭材料的微观结构和物化
姜良铎教授认为,三焦郁滞是失眠之本,火毒内生乃失眠之源,元气亏虚为失眠反复难愈之因。姜老临证从“三焦排毒”治疗失眠,调畅三焦是治疗失眠的基本大法,应贯穿治疗始终;失眠取效要重视火毒致病,治疗以“清火”为基石,辨证行清透郁火、清化痰火、清行瘀火之法,排毒时注意培补元气,以平为期。
目前,我国是世界上隧道及地下工程建设规模最大、数量最多、地质条件最复杂的国家。隧道建设逐渐向“长洞线、大埋深、高应力、强岩溶、高水压、复杂构造”趋势发展,突水突泥灾害日趋严重,造成了严重的人员伤亡与财产损失。而突水突泥灾害难以遏制的主要原因是灾变演化机理不清、监测预警缺乏理论依据与技术支撑。因此,亟需开展隧道突涌水灾害多元信息演化过程监测与融合预警方法的研究,实现突涌水灾害的有效主动防控。(1)阐
第一部分:基于单细胞测序的早期妊娠蜕膜CD4+T细胞特征分析研究背景:母胎界面局部免疫微环境稳态对于建立并维持生理妊娠起到重要的调控作用。母体免疫系统可在妊娠后发生一系列适应性改变,建立对胎儿父系来源的半异体抗原正确的免疫识别、应答及耐受,以维持正常妊娠并促进胎儿的生长发育,避免发生流产、早产、死产等不良妊娠结局。子宫蜕膜中存在大量免疫细胞,主要包括NK细胞(~70%)、巨噬细胞(~20%)、T细
直流电阻率法是一种经济、高效的工程地球物理探测手段,对含水构造敏感,已被广泛应用于公路铁路交通工程的地质勘查、水利水电工程隐患检测、环境工程污染物运移成像等领域。以观测数据重建地下电阻率模型的反问题具有多解性,因此,选用有效的反演方法是保证探测效果的关键。目前,线性反演是实际探测中的主流方法。但其反演结果容易陷入局部最优,产生错误的地质解译。深度学习反演方法在近几年成为研究热点,利用其超强的数据挖
现场报道是电视新闻现场采访、现场解说的一种报道形式,更能凸显电视新闻的真实性,更贴近观众和生活,这种报道形式对新闻记者的要求也更高,需要新闻记者具备较强的现场应变能力及广博扎实的知识储备。本文分析和探讨了电视新闻现场报道工作的相关问题,希望能够抛砖引玉,为具体工作的开展提供一些可行的借鉴经验。
本文以作者调查目验工作为基础,结合档案和实物,全面考察汉籍在俄罗斯的流布情况。第一章考察18世纪前期汉籍在俄流布情况。首先探讨了汉籍文本和汉籍实物不同的传播途径。汉籍传俄存在两条路径,汉籍文本由西欧转译,始于1730年拉丁文《大学》在俄出版,主要承载着欧洲启蒙思想而非中华文化;汉籍实物多由俄罗斯政府直接指示官方商队采购,但入藏后往往未得到翻译和研究。1727年俄罗斯外务院中国事务档案存有皇家科学院
幼儿阶段是人生的起始阶段,良好学习习惯的养成和积极学习行为的形成对幼儿未来的发展具有重要的意义。积极的学习品质包括对待学习的态度认真、富有想象力和创造力、能够专注于一件事、勇于探索、不畏困难等,幼儿在区域活动中能够调动自身的综合能力,有助于良好学习品质的形成。因此,教师应当为幼儿创设丰富且科学的区域活动,为幼儿提供开展区域活动的时间和空间,让幼儿在活动中自主学习,发挥主观能动性,从而丰富自身的经验