基于高斯过程的动态系统研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:mario2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时序数据是生活中常见的数据类型。这类数据通常具有动态性,即数据在相邻时刻之间相互关联。同时,数据也具有维度依赖性,即数据在不同维度之间也相互关联。数据中的动态性与维度依赖性,使得对时序数据的建模具有很大挑战性。利用概率模型框架,对时间与空间上的依赖关系进行联合建模是一种有效的解决方法。在概率模型框架中,高斯过程因其形式优雅而被广泛应用,它可以建模数据之间的非线性映射关系。为了解决时序数据建模中的挑战,关于高斯过程动态系统(Gaussian process dynamical system, GPDS)的研究在不断发展。根据模型假设与学习方法,我们将已有的GPDS分为两大类,高斯过程动态模型(Gaussian process dynamical model, GPDM)与变分高斯过程动态系统(variational Gaussian process dynamical system, VGPDS)。本文工作是在已有GPDS的基础上继续深入研究,并且提出更加合理的GPDS模型。首先,我们针对数据丢失问题提出了改进的GPDM,包括对应的模型学习算法与条件模型。GPDM是最近提出的一种成功应用于时序数据分析的模型,它的模型学习算法与条件模型均建立在完全训练数据的前提下。当数据不完全时,GPDM在优化更新参数之前,使用一个关于隐变量的重构函数对数据进行补全,然后使用完全数据下的学习算法进行模型训练。这种处理丢失数据的方法很可能会带来累计误差,所以我们针对不完全数据提出了改进的GPDM。在改进的GPDM中,改进的模型学习算法可以实现在不完全数据下的模型训练,改进的条件模型可以实现对丢失的测试数据的恢复。我们采用贝叶斯学习框架,对丢失数据进行积分,最终得到观测数据的边缘分布。所以改进的GPDM可以合理充分地利用部分已观测的数据。为验证改进的GPDM处理丢失数据的有效性,我们在不完全的运动捕获数据上进行实验,并将改进的GPDM与原GPDM、κ-NN、三次样条插值和VGPDS进行对比。改进的GPDM无论在处理训练数据丢失还是测试数据丢失方面都具有更大优势。其次,我们针对交通流预测问题提出了高阶GPDM。交通流预测是智能交通系统领域的一个重要的任务,它通常使用路口的历史流量信息来预测下一时刻的流量。提出准确高效的交通流预测模型将对智能交通系统的发展具有重要意义。我们将原有的GPDM从一阶模型扩展到更适用于交通流数据的四阶模型。具体地说,四阶GPDM的隐变量是一个四阶马尔科夫高斯过程。当模型训练结束后,为了实现更高效率的预测,我们结合带权值的k-NN来计算测试数据对应的隐变量。最终的预测结果由四阶GPDM与k-NN结合估计得到。对比其他流行方法,新提出的方法性能更优,并且预测准确率有显著性提高。然后,我们结合前面的工作成果,在相似的贝叶斯框架下,提出了变分依赖多输出高斯过程动态系统(variational dependent multi-output Gaussian process dynamical system, VDM-GPDS). VDM-GPDS具有处理复杂动态性的能力,可以更加合理地建模多元时序数据,特别是不同维度观测之间具有依赖关系的序列。与之前的GPDS明显不同的是,该模型假设多个输出之间具有依赖性。我们采用卷积多输出高斯过程来建模输出数据,以构建一种灵活的多输出协方差函数。在学习阶段,我们引入辅助变量,并采用变分推理方法,得到模型的对数似然变分下界。模型参数与变分参数通过使用基于伸缩共轭梯度的算法,最大化该下界得出。我们的模型因其合理的假设与完全贝叶斯的学习框架,在动态系统建模方面更具优势。我们在人工数据与真实数据上与多种方法进行对比实验,实验结果验证了所提模型的有效性。最后,为了使VDM-GPDS更具一般性,使其不仅适用于时序数据分析,同时也适用于静态数据回归,我们将VDM-GPDS调整为变分依赖多输出多层高斯过程回归模型(variational dependent multi-output multi-layer Gaussian process regression model, VDMM-GPRM)。VDMM-GPRM继承了原动态系统的优势,可以处理多输出或多任务的回归问题。在机器人逆动态问题上的实验结果验证了VDMM-GPRM在回归任务上的优势。本文的工作改进与完善了已有的GPDS,并进一步提出了新的建模时序数据的模型,最后将动态与静态数据的处理模型统一为一个框架。不同的实验设定均验证了所提方法的合理性与有效性。
其他文献
失业保险是针对因失业而暂时中断生活来源的劳动者提供物质帮助的一项社会保险制度,它具有保障生活和促进再就业的双重职能,同时也应具有预防失业的更高层面的功能。本文通过
近年来,移动通信业务同质化趋势明显,服务层面竞争激烈,在服务资源一定的情况下,如何有效地进行服务资源配置是电信运营企业面临的一个重要课题。随着服务渠道和形式多样化,
有机硒化合物通常具有较好的生物活性,而硒醚又是其中一种很重要的有机硒化合物。目前合成硒醚的方法尚有很多不足之处,我们在总结前人经验的基础上,用硒格氏试剂作反应物,直
"嫦娥奔月"是中国古代著名的神话,许多学者对其多有关注,这方面的研究成果也颇为丰硕。然而,由于王家台秦简面世较晚,已有研究成果大多建立在传世文献的基础上,即使少数学者
取代甲苯类化合物选择性氧化制备的一系列含氧化合物,如醇、醛、酸等,是很重要的有机化工中间体,有广泛的用途,具有很高的附加值。但是选择性氧化所得的产物大多是热力学不稳
趣味教学法是以激发学生学习兴趣为主要目的的一种教学方法,具有趣味性、多样性、创造性、灵活性等特征。在高中《生活与哲学》的课堂教学中实施趣味教学法非常必要:首先,《
跨国公司战略联盟是进入外国市场的有效途径,然而这种方式并不总是成功的,实际上跨国公司的战略联盟战略就是将外部的资源吸收到公司内部的内部化过程,在这个过程中实现成本
石油化工工程活动中,机电安装工程的施工技术水平与质量管理效果一直是业内人士广泛关注的问题之一。立足于现状,文章首先分析了石油化工工程机电安装工程设备的技术特征,其
具有生物活性的天然有机化合物大多数是杂环化合物,尤其是含氮、氧和硫杂原子的化合物在医药、农药、香料、电子材料等领域得到广泛应用。1,2,4-噻二唑和1,3,4-噁二唑等五元
目的探讨糖尿病口腔扁平苔藓(OLP)与抑郁以及空腹血糖、性别之间的相关性。方法将84例在口腔科门诊就诊的糖尿病OLP患者按病情分为糜烂组(38例)和非糜烂组(46例)测定空腹血糖