【摘 要】
:
尽管在过去的发展历程中,多视图学习领域取得了很大进步,但是由于很难对不同视图之间的复杂关联进行建模,这个问题仍然十分具有挑战性,尤其是在视图有缺失的情况下。为了应对这一挑战,本文提出了一个新颖的模型框架,旨在充分地、灵活地利用具有不同缺失模式的各个视图的数据。本文首先为多视图表示提供完备性和通用性的正式定义,然后从理论上证明了所学习的隐空间表示的通用性。对于完备性,通过模仿数据的信道传输理论,将学
论文部分内容阅读
尽管在过去的发展历程中,多视图学习领域取得了很大进步,但是由于很难对不同视图之间的复杂关联进行建模,这个问题仍然十分具有挑战性,尤其是在视图有缺失的情况下。为了应对这一挑战,本文提出了一个新颖的模型框架,旨在充分地、灵活地利用具有不同缺失模式的各个视图的数据。本文首先为多视图表示提供完备性和通用性的正式定义,然后从理论上证明了所学习的隐空间表示的通用性。对于完备性,通过模仿数据的信道传输理论,将学习多视图隐空间表示的任务转换为了一个退化过程,从而可以隐式地实现不同视图之间的一致性和互补性之间的最佳权衡。通过引入对抗策略,本文的模型一方面可以用于补全缺失的视图,另一方面又将所有视图中的信息(包括补全的视图)编码为隐空间的表示,从而进一步提高了所习得表示的完备性。此外,模型还引入了非参的分类损失来得到结构化的表示,同时也防止了过拟合,这使该算法在缺失视图的情况下在分类、表示学习和数据补全等多个任务上表现良好。在监督和无监督的任务场景下,具体做了如下研究:(1)基于缺失多视图场景下的有监督分类任务。此项工作提出一个新颖的框架CPM-Nets进行缺失多视图学习,该框架同时考虑了完备性和结构性,以习得一个统一的隐空间表示,该算法具备高度的灵活性,针对缺失的多视图数据具有很强的通用性。从观测数据反向编码而来的隐空间表示具备完备性和通用性,从而提高了预测性能;而聚类风格的分类损失反过来又增强了隐空间表示的可分离性。基于分类任务的理论分析和实验结果验证了所提出的模型的有效性。(2)基于缺失多视图场景下的无监督聚类及补全任务。对于无监督学习,此项工作提出CPM-GAN框架,采用退化编码方式,将来自观测数据的信息灵活地编码为隐空间表示。同时,通过引入对抗策略使得缺失的数据可以被补全,从而又进一步完善了隐空间的表示。基于聚类和补全任务的理论分析和实验结果验证了所提出的模型的有效性。
其他文献
蓝铁石结晶法作为污水污泥中回收磷资源的有效途径,近年来得到广泛关注。然而回收产物蓝铁石与污泥分离困难,极大地限制了这一方法的实际应用。针对这一问题,本论文探究了四方纤铁矿(Akaganeite,A)、针铁矿(Geothite,G)、赤铁矿(Hematite,H)三种不同铁氧化物铁还原性能的差异。基于铁球表面氧化还原过程,以铁芯小球为基体在其表面原位包覆铁还原效果较优的铁氧化物并生成蓝铁石,最后通过
我国是铬盐的主要生产国家,铬(Cr)污染已成为我国常见的一种土壤污染形式。为解决高浓度Cr(Ⅳ)污染土壤化学修复后的再氧化问题,本研究将多硫化钙还原与生物刺激联用,对高浓度Cr(Ⅳ)污染土壤进行修复,考察了修复过程中土壤p H、Cr(Ⅳ)浓度、Cr的不同形态浓度以及微生物群落多样性的变化,并对修复后土壤的浸出毒性及高锰酸钾氧化后的浸出毒性等进行检测。主要结果如下:(1)多硫化钙与生物刺激联合修复C
木质素储量丰富、来源广泛且廉价易得,在生产、生活中拥有重要的应用价值。通过一定的催化反应,打破木质素原有长链结构,将其高效转化为苯、苯酚等高附加值小分子化学品,一直是生物质能源领域的研讨热点。本论文聚焦于MoS2催化剂,通过添加铌酸助剂改变其物理化学性质以提升其催化性能,考察铌酸修饰二硫化钼催化剂在木质素模型化合物制芳香化合物反应上的加氢脱氧性能。论文工作首先采用一步水热法合成了一系列H4Nb2O
生物酶催化是指以酶为催化剂进行物质合成与转化的绿色催化过程。自然界存在多种涉及二氧化碳(CO2)转化的生物酶,可在温和条件下实现碳氧双键的精准活化,为碳资源高效利用提供了一条理想途径。应用过程中,固定化酶常常作为一种提升酶稳定性的策略,但固定化酶载体往往会导致催化过程内、外扩散阻力增加,酶表观活力下降。本论文通过耦合MOFs固定化酶策略与Pickering乳化技术,构建了基于CA@ZIFs的Pic
三氯生(Triclosan,TCS)广泛存在于水体和土壤环境中难以去除,并对人类健康和生态环境造成了长期的危害。植物作为环境中的重要生物介质,影响着TCS的环境行为与归趋模式,TCS对植物的生态毒理效应也越来越成为抗逆研究的热门领域。植物内源信号分子水杨酸(Salicylic acid,SA)广泛参与植物对各种生物和非生物胁迫的抗逆反应,能通过水杨酸羧基甲基转移酶(Salicylic acid c
口语理解是对话系统中的重要组成部分,负责将用户输入的文字信息转换成计算机所能理解的结构化语义信息。在本研究中,主要围绕对话行为识别、意图理解和槽填充三个子任务展开,以双注意力机制为基础解决目前子任务中存在的问题。双注意力机制主要包括两个注意力编码分支结构,通过对双分支进行联合训练获取额外的句子特征,能够有效利用和交换双分支结构中特征信息,提高模型鲁棒性。首先,对话行为识别任务中数据不平衡问题比较突
随着移动互联网技术的全面发展,社交媒体(例如:微博、Twitter、抖音等)依靠其独有的便捷性和服务已经成为促进人与人交流,获取和传播新闻资讯,分享意见和观点的重要平台。然而当热点事件发生时,数百万的用户短时间内会产生大量嘈杂简短的信息,因此如何从社交媒体数据中快速获取想要的内容至关重要,对社交舆情监控、危机预警具有重要意义。旨在从特定事件找到一组代表性帖子,生成简洁的摘要,以揭示给定热点事件中大
汞及其化合物具有强烈的神经毒性,可以通过水生食物链富集,对高营养级水生生物和人类健康产生威胁。在全球汞循环中,大气是最重要的传输途径。大气中汞的存在形式有气态元素汞(Gaseous Elemental Mercury,GEM)、活性气态汞(Reactive Gaseous Mercury,RGM)和颗粒态汞(Particle-bound Mercury,PBM)。不同形态的汞具有不同的物理化学性质
沿海地区经济的快速发展,使得土地资源的需求量不断增加。但随着工业的发展,滨海盐碱地区土壤重金属污染现象日益严重,这不仅降低了土地利用率,对城市环境也会产生不良影响。因此滨海重盐碱地区重金属的污染修复受到了广泛的关注,其中存在的盐碱成分又使得重金属的修复更具难度。根据研究发现,重金属的原位修复方法中,化学钝化方法以其便利性和实用性受到广泛应用。本文在实验室已有研究的基础上,探究新型重金属钝化剂——水