基于数据扩充的小样本学习算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:xiaoxiaoshixisheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的监督学习方法通常需要大量标注数据来进行模型训练,但是在很多实际的机器学习任务上,收集并标注大规模数据集非常困难。为此,如何利用小规模的数据来进行有效的模型训练便成为当前机器学习研究重点关注的、亟待解决的问题。在此背景下,本文针对数据受限情况下的小样本算法展开研究,重点关注利用数据增广在额外的无标签数据上学到具有泛化性的先验知识以及更高效地扩大训练数据规模,并提出创新的方法。本文的主要工作如下:1.提出了一种基于分离增广的无监督小样本学习框架ULDA。针对无监督表征学习如何利用增广方法得到更有效模型的问题,本文提出了基于分离增广的无监督小样本学习框架ULDA,即采用分离的数据增广方法强化通过数据增广构建的小样本训练任务内部的差异性。同时,本文提出了一种新的数据增广方法DSTIM来进一步强化不同视图在分布上的差异。在多个无监督小样本学习任务上,本方法均取得了不错的效果。2.提出了将域增广与知识解耦结合的无监督跨域小样本学习算法FewNorm。FewNorm通过数据增广扩大无监督数据上学到的知识空间,并通过衡量源域训练数据以及目标域少量标记样本在分布统计量上的差异的方式,对模型每一层的特征在不同通道上进行解耦,以提升模型迁移能力。整个FewNorm模块可以替换掉当前网络的归一化层,并且不引入太多的计算复杂度。实验验证了本文所提方法的有效性。3.提出了一种用于小样本学习的自动数据增广框架DeepAugNet。本文将搜索最佳数据增广方式的过程建模为序列决策问题,并提出采用强化学习探索增广每张图片后能给模型带来最大收益的自动数据增广框架DeepAugNet。在此框架中,DeepAugNet可以将数据增广模型和任务模型的训练结合起来,并可采用端到端的方式同时对其进行优化。实验验证了 DeepAugNet在各种小规模数据集上的有效性。
其他文献
目前,高校的数据库课程以及研究生入学考试希望考核学生实际编写SQL语句的能力,评测其实机操作的能力。与笔试的考核方式不同,实机操作需要实际运行学生所编写的SQL语句,为此,需要一个可以供学生在线编写SQL来答题的考试系统,同时在学生提交自己编写的SQL后运行并给出结果,并以通过的题目数量来作为学生考试的成绩。基于以上背景,本文提出并设计和实现了一个在线SQL考试系统,并介绍了在线SQL考试系统的题
随着深度学习领域的不断成熟,互联网公司开始在各个业务领域使用深度学习建模方法来分析用户数据并为用户提供服务。但是,训练好的深度学习模型需要经过一系列复杂的工程化处理流程才能应用到生产环境中。由于互联网产品的业务需要,其使用的深度学习模型需要不断变更,而每次变更都需要重新将模型进行工程化处理。因此,模型工程化需求越来越多,仅凭人力已经难以应对如此庞大的工作量。本文以国内某大型互联网公司的模型工程化需
为研究不同避障模式下深海采矿整体系统动力学行为,基于虚拟样机技术建立2.5km硬管+软管水力输送系统虚拟样机模型,提出两种可能的避障模式(垂直、水平避障模式),分析在这两种避障模式下、软管起拱数量、避障速度、避障大小以及中间仓质量对模型动力学行为的影响,并进行模拟实验研究。主要研究内容及成果如下:(1)两种避障模式下,软管呈双拱时系统各重要连接点的受力大小和走向大致一样,但双拱状态下系统在避障时的
学位
建筑外墙作为建筑围护的一部分,不仅表现了材料的结构和形式,而且也是社会文化环境的体现。外墙为建筑物提供保温隔热、遮阳遮雨、通风隔声等基本功能,还提供了基本的美学舒适度。传统单层墙很难满足现代建筑日益增强的保温需求,逐渐发展的双层空腔墙解决保温问题之后,又带来了空腔排水通风等一系列问题,那么如何更好地解决墙体排水通风以及耐久性的问题?雨幕系统外墙以这些问题为基础进行思考设计,不断更新着更高效能的墙体
学位
作为软件系统中的重要组成部分,注释对于程序理解和软件维护有着重大意义。软件开发过程中,项目代码与其注释往往存在不一致的问题,这在增加程序理解难度的同时,也大大降低了软件的可维护性。现有工作大多利用程序分析和文本分析技术来检测代码与注释参数约束的不一致性。然而,由于现有使用程序分析进行检测的方法大多仅基于AST,往往存在缺失控制流和数据流信息的问题,而文本分析技术则存在参数约束识别率低的问题;此外,
【目的】通过文献研究、现状调查、半结构化访谈、专家会议等研究方法,科学总结目前护士参与的胰腺MDT诊疗模式工作概况,分析评价目前所存在的问题,基于护士角色功能,探索构建信息化MDT改进方案,设计研发胰腺疾病MDT诊疗信息平台,为患者提供规范化、个性化、一站式医疗服务,渗透护士角色功能,深化护理服务内涵,完善高级执业护士理论。【方法】1.文献研究。首先通过文献研究,掌握了国内外胰腺疾病MDT诊疗模式
学位
学位