论文部分内容阅读
随着深度学习和人工智能的快速发展,表示学习成为学术界和工业界一个日益重要的课题。在本文中,关注两类常见数据的表示学习;图像数据和图结构数据。对于图像数据,首先针对一类特殊的图像数据;摄像头下的行人图像数据的表示学习,然后研究一般的图像数据的表示学习。对于图结构数据,重点研究时空图结构数据的表示学习及其应用。
在近几年内,已经有大量针对图像和图结构数据的表示学习研究,学习效果取得了显著的提升。但是,仍然有一些挑战需要解决:(1).在行人图像的表示学习方面,已有的研究以模型结构的研究为主,这导致模型变得复杂,增加了计算和存储的代价以及过拟合的风险,然而很少有研究工作关注已有模型的优化方法。(2).进一步,扩展到一般的图像数据表示学习。常用的联合优化方式使得卷积神经网络中存在不同层之间自适应的现象,这种现象会对图像表示学习效果产生负面影响;(3).在时空图结构数据的表示学习方面,已有的研究只关注了节点上的表示学习,忽略了边上的信息,造成了表示学习的效果欠佳,并且信息上不完整。针对上述挑战,进行了如下的研究工作:
1.针对行人表示学习研究中对模型优化方法关注较少的挑战,提出了一种自激励的判别性行人表示学习方法。该方法可以在不改变测试阶段模型结构的条件下,提高已有行人表示学习模型的性能。在三个公开数据集上验证了该方法可以带来模型性能上的显著提升,并且达到了目前准确度最高的行人重识别结果。
2.针对图像表示学习模型中自适应现象带来的挑战,提出了一种基于模型自适应现象解耦合的图像表示学习方法。该方法通过在训练阶段构造一系列弱分类器,加强在特征提取层上的优化力度。在实现方式上,对已有的类似方法做出了重大改进,并且提出了理论保证。在行人重识别、人脸识别等任务上验证了该方法的有效性。
3.针对时空图数据上表示学习结果不完整的挑战,提出了一种基于对偶图网络的时空图结构数据表示学习方法。该方法同时利用历史的节点和边的特征,学习未来节点和边的特征。在网络内部,提出对偶映射模块来建模节点和边之间的信息交互。将该方法应用于交通预测场景,在模拟和公开的交通预测数据集上验证了该方法的有效性。
在近几年内,已经有大量针对图像和图结构数据的表示学习研究,学习效果取得了显著的提升。但是,仍然有一些挑战需要解决:(1).在行人图像的表示学习方面,已有的研究以模型结构的研究为主,这导致模型变得复杂,增加了计算和存储的代价以及过拟合的风险,然而很少有研究工作关注已有模型的优化方法。(2).进一步,扩展到一般的图像数据表示学习。常用的联合优化方式使得卷积神经网络中存在不同层之间自适应的现象,这种现象会对图像表示学习效果产生负面影响;(3).在时空图结构数据的表示学习方面,已有的研究只关注了节点上的表示学习,忽略了边上的信息,造成了表示学习的效果欠佳,并且信息上不完整。针对上述挑战,进行了如下的研究工作:
1.针对行人表示学习研究中对模型优化方法关注较少的挑战,提出了一种自激励的判别性行人表示学习方法。该方法可以在不改变测试阶段模型结构的条件下,提高已有行人表示学习模型的性能。在三个公开数据集上验证了该方法可以带来模型性能上的显著提升,并且达到了目前准确度最高的行人重识别结果。
2.针对图像表示学习模型中自适应现象带来的挑战,提出了一种基于模型自适应现象解耦合的图像表示学习方法。该方法通过在训练阶段构造一系列弱分类器,加强在特征提取层上的优化力度。在实现方式上,对已有的类似方法做出了重大改进,并且提出了理论保证。在行人重识别、人脸识别等任务上验证了该方法的有效性。
3.针对时空图数据上表示学习结果不完整的挑战,提出了一种基于对偶图网络的时空图结构数据表示学习方法。该方法同时利用历史的节点和边的特征,学习未来节点和边的特征。在网络内部,提出对偶映射模块来建模节点和边之间的信息交互。将该方法应用于交通预测场景,在模拟和公开的交通预测数据集上验证了该方法的有效性。