基于深度表征网络的多视角学习方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:dubo2536
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字化时代的到来,数据的形态非常丰富,描述同一实例的不同类型数据被称为多视角数据。基于多视角数据,多视角学习旨在通过融合来自多个视角的补充信息来发现潜在的表征。可以根据数据的完整性将多视角学习分为完整视角表征和缺失视角表征,本文围绕完整视角和缺失视角的表征学习展开研究。对于完整视角的表征学习,基于子空间学习的方法是目前较为主流的方法,但是当前基于子空间学习的方法存在两个缺点:(1)多视图关系未嵌入特征学习中,仅仅作用于子空间学习。(2)深度学习的端到端学习方式未在多视图中被使用。所以如何有效的端到端联合表征和子空间建立成为了一个重要的问题。与完整视角数据相比,缺失视角数据在现实生活中更为常见,而对于缺失数据,当前的方法主要存在以下局限:(1)基于缺失视角补充的方式无法对生成结果进行有效约束(2)基于数据分组的手段,在缺失数据较多时容易造成过拟合(3)基于隐层的弹性表征方式没有考虑到样本级别的交互,并且训练与测试过程不一致。本文主要对两种数据类型的表征学习进行研究,对于完整视角的表征学习来说,本文提出了一种新颖的深度子空间多视角表征网络,利用端到端的方法联合表征学习和子空间建立,使得多视角信息贯穿于网络的整个学习过程。该网络包含两个子模块,分别是多样性部分和一致性部分,都是利用卷积自编码器提取独立和共同的子空间表达,并利用两种正则化方法进行约束。丰富的实验验证了深度子空间多视角网络在聚类任务上强大的性能。而对于缺失视角表征学习来说,本文聚焦于弹性的隐空间表征,提出异构图学习的方法来动态捕捉实例间的复杂关系,将原有的归纳学习方式转变为转置学习,从而执行半监督学习分类任务,实验证明了该方法在不同缺失比例下的有效性。
其他文献
随着移动互联网技术的全面发展,社交媒体(例如:微博、Twitter、抖音等)依靠其独有的便捷性和服务已经成为促进人与人交流,获取和传播新闻资讯,分享意见和观点的重要平台。然而当热点事件发生时,数百万的用户短时间内会产生大量嘈杂简短的信息,因此如何从社交媒体数据中快速获取想要的内容至关重要,对社交舆情监控、危机预警具有重要意义。旨在从特定事件找到一组代表性帖子,生成简洁的摘要,以揭示给定热点事件中大
学位
汞及其化合物具有强烈的神经毒性,可以通过水生食物链富集,对高营养级水生生物和人类健康产生威胁。在全球汞循环中,大气是最重要的传输途径。大气中汞的存在形式有气态元素汞(Gaseous Elemental Mercury,GEM)、活性气态汞(Reactive Gaseous Mercury,RGM)和颗粒态汞(Particle-bound Mercury,PBM)。不同形态的汞具有不同的物理化学性质
学位
沿海地区经济的快速发展,使得土地资源的需求量不断增加。但随着工业的发展,滨海盐碱地区土壤重金属污染现象日益严重,这不仅降低了土地利用率,对城市环境也会产生不良影响。因此滨海重盐碱地区重金属的污染修复受到了广泛的关注,其中存在的盐碱成分又使得重金属的修复更具难度。根据研究发现,重金属的原位修复方法中,化学钝化方法以其便利性和实用性受到广泛应用。本文在实验室已有研究的基础上,探究新型重金属钝化剂——水
学位
尽管在过去的发展历程中,多视图学习领域取得了很大进步,但是由于很难对不同视图之间的复杂关联进行建模,这个问题仍然十分具有挑战性,尤其是在视图有缺失的情况下。为了应对这一挑战,本文提出了一个新颖的模型框架,旨在充分地、灵活地利用具有不同缺失模式的各个视图的数据。本文首先为多视图表示提供完备性和通用性的正式定义,然后从理论上证明了所学习的隐空间表示的通用性。对于完备性,通过模仿数据的信道传输理论,将学
学位
计算机视觉和自然语言处理是两个非常热门的研究方向,其中包括图像或视频的分类、检测、分割等视觉任务或是机器翻译、文本摘要、问答系统等自然语言任务,这些任务目前已有很多基于深度神经网络的模型。现实生活中,大部分时刻需要同时理解视觉和自然语言信息,因此,目前在两个领域结合的方向,涌现了很多新的任务:如视觉描述生成、文本图像生成等内容。这其中,视频问答任务近几年取得了飞速的发展,它要求模型输入视觉信息和问
学位
由于RDF图数据的急剧增长,传统的集中式数据处理已经不能满足当前需求,必须通过分布式集群来存储和处理大规模RDF图数据。RDF图数据的分布式存储面临的第一个问题即是RDF图划分。这就使得如何有效地划分大规模RDF图变得尤为重要。本文对现有的RDF图划分算法进行整理,将图划分算法分为3种类型,分别是多级图划分算法、流式图划分算法和分布式图划分算法,详细描述了其中的代表性算法。通过在合成数据集与真实数
学位
目前深度学习已经在多个领域中获得了令人瞩目的成就,但深度学习的成功往往依赖于大规模有标注的数据集,这不仅限制了其在特定领域的应用,也与人类能够从少量样本中快速建立概念有较大差距。小样本分类旨在通过少量有标注样本学习出有效的模型,能够对新类进行识别。而半监督条件下的小样本分类则是对当前小样本研究的进一步拓展,半监督条件一方面更加贴近人类对于事物类别的认知方式,另一方面在实际应用中无标记的数据的收集往
学位
随着天文观测数据的日益丰富,天文学研究已经进入大数据时代。随着光学望远镜制造技术不断发展,高分辨率和宽视场的天文光学观测图像数据持续增速积累。对于时域天文学研究,天文学家通常关注于某一片天空区域内发生的变化或者某一个星体自身发生的变化,并不需要处理所有的归档图像数据,因此如何保证能够快速从海量的归档数据中检索出天文学家所需要的图像序列是一个亟待解决的挑战。本文面向基于光学图像数据的时域天文学研究,
学位
天文观测对大气环境质量、防信号干扰能力等方面的要求非常高,因此,观测条件越好的地点越是人迹罕至。由于观测地点长期无人值守,在观测站点部署高可靠、低成本的远程数据传输系统非常有必要。例如,南极昆仑站天文观测现场与国内数据中心之间只能依靠铱星通信系统进行数据传输。然而,铱星通信网络的带宽极为有限,并且相当不稳定,流量成本也非常昂贵。因此,常规的数据传输工具,例如rsync和scp,并不适用于这种传输场
学位
语音合成(Text-to-Speech,TTS)是一种将输入文本转换为合成语音的技术。在人机交互场景中,语音合成作为交互链条中最后一步,具有举足轻重的地位。目前随着端到端技术的提出和日趋成熟,单语种单说话人语音合成系统,已经能够合成与人类发音具有相似自然度的语音,但是在实际应用场景中,单语单说话人语音合成系统已经无法满足人们的日常需求。比如在导航系统中出现的含有英文单词的地址,日常交流中出现的英文
学位