【摘 要】
:
随着数据规模和计算资源的快速增长,机器学习已成为大数据分析、计算机视觉、自然语言处理等任务的主要技术基石之一。大多数机器学习方法通常假设数据是来源于同一个分布的。然而在实际应用场景中,数据往往可以根据其分布被划分为彼此不同但又互相关联的子组。这样的子组通常被称为领域。对人类来说,将一些领域(称为源领域)的数据和知识映射、迁移到另外一些领域(称为目标领域)并非难事。然而对机器学习而言,想要实现这样的
论文部分内容阅读
随着数据规模和计算资源的快速增长,机器学习已成为大数据分析、计算机视觉、自然语言处理等任务的主要技术基石之一。大多数机器学习方法通常假设数据是来源于同一个分布的。然而在实际应用场景中,数据往往可以根据其分布被划分为彼此不同但又互相关联的子组。这样的子组通常被称为领域。对人类来说,将一些领域(称为源领域)的数据和知识映射、迁移到另外一些领域(称为目标领域)并非难事。然而对机器学习而言,想要实现这样的跨领域数据映射和知识迁移通常需要大量的标签信息来训练一个跨领域映射/迁移模型。但是,获得标签的过程会耗费大量的人力物力,甚至在某些情况下根本无法获得标签。因此,如何在没有标签信息下实现跨领域数据映射和知识迁移成为机器学习中亟待解决的问题。无监督跨领域学习的提出正是为了解决这一问题。无监督跨领域学习放宽了传统机器学习中数据必须来源于同一个领域的约束,在给工业界和学术界带来许多机遇的同时也面临着诸多挑战。本文重点面向无监督跨领域学习中领域映射、领域适应和领域泛化任务,研究如何在不同领域之间挖掘领域不变的本质特征和结构以及每个领域独有的特性,从而使得数据和知识可以在领域间实现转换和迁移。本文的主要研究内容和创新点可以概括为:(1)提出一种基于运动引导的无监督视频领域映射方法。无监督视频领域映射的目标是在没有任何配对的训练样本情况下学习一个映射使得视频可以从源领域转换到目标领域。这种视频领域映射不仅要求映射后的视频每一帧的视觉外观是真实的,而且连续帧之间的运动也是真实的。为此,本文提出一种新的运动引导的循环生成对抗网络,创新性地将运动估计引入到无监督领域映射任务中。该网络使用了三种约束:1)对抗约束通过生成器和判别器两个网络的极大-极小训练策略将源领域视频帧转换到目标领域。2)视频帧以及帧间运动循环一致约束隐式地保证生成的目标领域视频保留输入源领域视频的语义和运动信息。3)运动转换约束进一步增强了生成的目标领域视频在时域上的连续性。实验结果表明,该方法可以有效地提升视频转换质量,并在多个标准数据集上都取得了比现有无监督视频领域映射模型更优的性能。(2)提出一种基于可迁移对比学习的无监督领域适应方法。无监督领域适应旨在利用有标签的源领域数据和大量无标签的目标领域数据,学习一个能在目标领域表现良好的模型。领域适应的最新进展是利用自监督学习来提升无标签目标领域数据特征的跨领域不变性。然而大多数现有的领域适应方法都将自监督学习视为独立的辅助组件,没有考虑到其本身的目标是消除领域分布差异。相反地,本文提出一种专门为领域适应任务定制的自监督学习范式,即可迁移对比学习。该范式将自监督学习和领域适应有机地结合起来,可以同时提升模型的跨领域迁移能力和分类判别能力。实验结果表明,本方法在多个无监督领域适应基准数据集上都取得最先进的性能。(3)提出一种基于风格与语义记忆机制的领域泛化方法。领域泛化旨在从若干个源领域数据中学习一个泛化能力强的模型,以便在训练时未见过的目标领域数据上取得较好的结果。目前最先进的领域泛化算法往往优先考虑跨领域的语义不变性假设,而忽略了领域内固有的风格不变性。本文发现利用领域内风格不变性对于提高模型领域泛化的能力至关重要。本文使用一种风格与语义记忆机制来存储不同领域不同样本的风格和语义特征,并提出实例级别的风格对比损失函数和“陪审团”机制进行域内不变的风格特征学习和域间不变的语义特征学习。最终,模型学到的语义特征可以很好地泛化到目标领域。实验结果表明,本方法在多个领域泛化基准数据集上的性能都达到领先水平。
其他文献
埃迪卡拉纪瓮安生物群发现于我国贵州的陡山沱组地层之中,是一个磷酸盐化特异埋藏化石库,其中的化石以三维立体的形式保存了精美的细胞和亚细胞结构。除了多细胞藻类之外,瓮安生物群中保存了大量可能与动物有亲缘关系的胚胎状化石,这些化石记录了个体发育的不同阶段,为探讨动物发育方式的演化起源提供了重要材料。然而,这些胚胎状化石具体的生物学属性和系统学位置仍然充满争议。目前对于这些化石生物学属性的假说主要:冠群动
<正>夏季气温升高,苍蝇也随之活跃了起来。这些讨厌的小昆虫,飞行速度快,复眼的动态视力十分敏锐,体表刚毛又可以感知十分细微的空气震动,因而驱赶不走,又难以捕捉。沈凡琪同学对这一问题产生兴趣,开展了研究。研究起源蝇次目昆虫有7万多个种,它们的总称就叫苍蝇。人们在日常生活中最常遇到的苍蝇,应该是家蝇。它们虽然是生态系统中不可缺少的分解者,但也是传播疾病的媒介,让人烦恼。
腔衰荡光谱技术是一种高灵敏的气体检测技术,适用于大气痕量气体检测。但激光频率噪声导致的激光到光学谐振腔的低耦合效率极大地限制了腔衰荡光谱技术的探测灵敏度。光学反馈技术是一种经济且有效的激光频率稳定技术,可以有效抑制激光频率噪声,提高激光到光学谐振腔的耦合效率。大多数的腔增强光谱技术采用的光腔是由两个高反射率腔镜组成的线性腔,而基于光反馈的腔衰荡光谱技术认为入射腔镜的直接反射光会造成光学反馈竞争,采
随着经济和社会的发展,能源矛盾日益加剧,生态环境问题突出,构建清洁、高效、安全、可持续的能源尤其重要。超级电容器因其较高功率密度、快速充放电速率、超长循环寿命等特点,使其在储能领域具有广阔前景。生物质基炭电极材料因其环境友好、天然资源丰富和特殊的多孔结构而备受关注。本文基于碱/脲溶剂对纤维素的溶解作用,以木质原料和纤维素为碳源,尿素、硫脲为掺杂源,三聚氰胺和磷酸三聚氰胺为辅助物(掺杂剂),碱为活化
试验旨在研究后生元对肉鸡抗氧化能力及肝功能的影响。试验选用1日龄健康、体重相近的WOD168母雏510只,随机分为3组,每组5个重复,每个重复34只。对照组饲喂基础饲粮,抗生素组在基础饲粮中添加5×10~7 U/t盐酸大观霉素和25 g/t盐酸林可霉素可溶性粉,后生元组在基础饲粮中添加750 g/t后生元。试验分为2个阶段:1~21 d和22~35 d。在21、35 d分别对各试验组进行屠宰、采样
<正> “驱蝇树”是用野生植物,经人工驯化而成。在植物体内有强烈的“杀菌素”。它在生长过程中其每个生长期,都分泌出不同量的挥发性物质即杀菌素。这种杀菌素比其它植物体内存在的成分能多
利用可再生电力将二氧化碳、氧气、氮气等小分子还原为增值品,有望成为实现可再生资源再利用的有效解决方案。迄今为止,电催化反应仍依赖于贵金属作为催化剂,如氧还原反应(ORR)活性最高的催化剂是Pt族贵金属纳米材料,其根本原因在于贵金属具有特殊的d带电子结构,可与气体反应物分子产生良好的吸附,并且能在酸碱腐蚀性介质中保持优良的稳定性。然而,由于贵金属本身资源稀缺、成本高昂、合成程序复杂等因素阻碍了其在能
<正>止痒驱蝇膏是治疗皮肤病的软膏涂擦剂,笔者多年临床应用,认为对皮肤病的适应症广泛,且能驱避蚊蝇叮伤,具有抗虫灭菌、消炎止痒、改善皮肤新陈代谢、促进患部恢复之功能。 药膏配制 取敌百虫15.0克、硫磺20.0克、鱼石脂40.0克、松节油40毫升、克辽林40毫升、凡士林250.0克,充分调配均匀,置软膏罐内备用。可长期使用,无变质之虑。
经过改革开放后40多年的快速发展,目前我国城镇化已经进入向高质量发展转变阶段,如何发挥城镇化空间集聚效应带动农村可持续发展,以减少发展空间不平等、提高社会整体福利成为城乡协调发展的重要议题。城镇化的本质是经济活动空间集中发展,探讨城镇化空间结构对农村可持续发展能力的影响与影响机制与约束机制,对促进我国城乡协调发展具有重要意义。本研究收集了2004—2017年间中国省域与城市群两种空间尺度的面板数据