图像和图结构数据的表示学习研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:weinziel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习和人工智能的快速发展,表示学习成为学术界和工业界一个日益重要的课题。在本文中,关注两类常见数据的表示学习;图像数据和图结构数据。对于图像数据,首先针对一类特殊的图像数据;摄像头下的行人图像数据的表示学习,然后研究一般的图像数据的表示学习。对于图结构数据,重点研究时空图结构数据的表示学习及其应用。
  在近几年内,已经有大量针对图像和图结构数据的表示学习研究,学习效果取得了显著的提升。但是,仍然有一些挑战需要解决:(1).在行人图像的表示学习方面,已有的研究以模型结构的研究为主,这导致模型变得复杂,增加了计算和存储的代价以及过拟合的风险,然而很少有研究工作关注已有模型的优化方法。(2).进一步,扩展到一般的图像数据表示学习。常用的联合优化方式使得卷积神经网络中存在不同层之间自适应的现象,这种现象会对图像表示学习效果产生负面影响;(3).在时空图结构数据的表示学习方面,已有的研究只关注了节点上的表示学习,忽略了边上的信息,造成了表示学习的效果欠佳,并且信息上不完整。针对上述挑战,进行了如下的研究工作:
  1.针对行人表示学习研究中对模型优化方法关注较少的挑战,提出了一种自激励的判别性行人表示学习方法。该方法可以在不改变测试阶段模型结构的条件下,提高已有行人表示学习模型的性能。在三个公开数据集上验证了该方法可以带来模型性能上的显著提升,并且达到了目前准确度最高的行人重识别结果。
  2.针对图像表示学习模型中自适应现象带来的挑战,提出了一种基于模型自适应现象解耦合的图像表示学习方法。该方法通过在训练阶段构造一系列弱分类器,加强在特征提取层上的优化力度。在实现方式上,对已有的类似方法做出了重大改进,并且提出了理论保证。在行人重识别、人脸识别等任务上验证了该方法的有效性。
  3.针对时空图数据上表示学习结果不完整的挑战,提出了一种基于对偶图网络的时空图结构数据表示学习方法。该方法同时利用历史的节点和边的特征,学习未来节点和边的特征。在网络内部,提出对偶映射模块来建模节点和边之间的信息交互。将该方法应用于交通预测场景,在模拟和公开的交通预测数据集上验证了该方法的有效性。
其他文献
随着三维扫描技术与计算机图形图像技术的发展,三维体数据模型的数量迅速增长,并广泛应用于医学虚拟手术规划、三维地质体建模、机械CAD设计、气象预测以及流体力学模拟等领域。因此,如何实现体数据模型快速而有效的检索具有重要的理论意义和实际应用价值。目前体数据检索方法多是基于体数据切片的几何与非几何特征进行,其实质是基于二维切片的颜色、纹理及形状等特征进行的,这势必会丢失体数据的三维空间特征,诸如空间形状
大数据环境的需求下,研究对象一般具有非线性、非凸、高维、超多目标等多种性质或者其中一种。如何对具有高维甚至超高维特征的优化问题进行有效求解,成为目前计算智能领域的一个严峻挑战。受物质在不同相态下丰富运动规律的启发,通过对其运动特性的观察和分析,抽象出自然现象中所蕴含与之相关联的搜索特性及其内在信息处理机制,提出了一种基于物态运动原理的计算模型,在此基础上设计了几种不同类型的优化算法,以解决传统智能
不确定性广泛存在于各类系统中,自动控制系统也不例外。这些不确定性来自于系统外部扰动、内部联结与耦合、子系统故障、参数波动等,不确定性的存在严重影响着系统的正常运行。自从有了控制理论以来,对不确定性的研究就从未停止,反馈控制、自适应控制、鲁棒控制与系统辨识都是解决不同类不确定性的典型代表。试图通过控制与辨识的方法使系统目标间的指标达到某种平衡,这种方法被称之为对偶自适应控制,在千禧之年其被IEEE
随着科技的发展,现实中的优化问题越来越复杂,采用传统优化方法已难以进行有效求解,故而迫切需要探索一些高效的智能优化方法。受自然界中某些现象或过程的启发,研究人员提出了多种演化算法(Evolutionary Algorithms,EAs)范例,为复杂优化问题的求解提供了新的途径。然而,随着迭代的进行,演化算法的种群多样性难以维持,从而易导致全局勘探与局部搜索的失衡。此外,在求解不同类型的优化问题时,
学位
与传统悬架相比,空气弹簧的独特性赋予了汽车空气悬架更多性能优势,通过调节车身高度和对阻尼实现自适应控制,空气悬架不仅可以有效改善车辆在行驶过程中的乘坐舒适性、操作稳定性和行驶安全性,而且能够在一定程度上提高车辆的燃油经济性,已成为汽车工程界的研究热点之一。  车高调节以及其过程中的整车姿态控制是电控空气悬架(Electronically Controlled Air Suspension,ECAS
优化问题是科学研究和工程实践领域中的热门问题。经过近几十年的发展,群体智能优化算法以其简单、灵活、高效等特点,已成为解决全局优化问题的主要技术。经典的群智能优化算法有粒子群算法(PSO)和蚁群算法(ACO)。一方面,这些算法主要是在搜索过程中引入了随机性,能够有效的避免陷入局部解。另一方面,大多数需要优化的实际工程问题都伴随着大量的局部解。因此,采用群智能优化算法来获得全局优化问题中的最优解具有重
学位
在经济系统、飞行控制系统、机器人操作系统等实际应用中,由于子系统间耦合的变化、环境的突然干扰或其它原因,系统的参数和结构都可能发生突变。为了更加贴切的对突变系统进行描述,一般采用兼有离散和连续变量两种运行机制的混杂动态系统进行建模,模态之间的转换有多种表示形式,其中由于Markov链具有特殊的Markov性,因此通常使用具有Markov切换的微分方程来解决。在过去的几十年里,这一领域的主要成果已经
多自主体系统在工业、军事、医疗和交通运输等诸多领域有着广泛引用。由于实际中的多自主体系统往往具有非线性特性,并且因空间、能量以及执行器和传感器结构的限制使得系统通常受饱和约束,因此,开展非线性多自主体抗饱和一致性策略研究具有重要理论意义和潜在应用价值。鉴于此,本文针对受饱和约束的非线性多自主体系统,基于脉冲、模糊和神经网络等先进控制理论开展一致性控制策略研究。主要研究内容包括:  针对一类具有执行
机器学习的不断发展、大数据技术和深度学习的快速兴起,对数据处理硬件的速度、体积、功耗提出越来越高的要求。但是受到摩尔定律逐渐失效和冯·诺依曼架构瓶颈的制约,现有的CMOS硬件平台已经渐渐不能满足海量数据处理的需求,这促使人们开始探索下一代的数据处理硬件。在新兴的数据处理硬件平台中,忆阻神经网络电路被认为是解决现有制约的最具潜力的硬件平台之一。因此,研究忆阻神经网络电路设计具有重要意义。  模拟联想
人脸识别作为深度学习重要应用之一,在近几年中取得突破性进展,被广泛应用在视频监控、客流疏通、火车机场安检等领域。对人脸识别系统而言,人脸图像样本的采集是最基础的一环,但采集大量样本成本很高,且在护照和身份证信息核对等实际应用中,只能采集到的每个个体身份证上的人脸图像,这就产生了只有单张训练样本的单样本人脸识别。只利用一张训练样本在光照、表情、遮挡等约束条件以及无约束条件下识别出目标样本。由于类内变
学位