基于流形学习的时间序列聚类研究

来源 :河北经贸大学 | 被引量 : 2次 | 上传用户:linnber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界不是静止不动的,而是随着时间在不断变化。时间序列一般是维数比较高且按时间次序进行排列的数据。它的生成过程极易受周围环境的影响,并且有部分噪声,时间点一般是连续且均匀分布的。聚类是对没有类标签的实例根据相似度进行分组,相似度大的实例分为一组,不同组之间的实例相似度最小。时间序列聚类普遍应用于工业、农业、交通、手势识别等行业。它的应用实例有很多,如投资组合风险管理、自然语言理解、交通流等。本文以时间序列数据为研究对象,探讨了利用不同的流形学习算法对时间序列数据进行聚类以及聚类融合,从而提高聚类性能。本文的主要研究工作如下:(1)基于流形学习的时间序列聚类研究。时间序列数据通常不仅数据量大,而且是高维的,直接对原始数据集进行聚类,得到的聚类性能一般不会很好。如何有效的对时间序列降维,而且保留原数据集的主要信息,是本文的一个研究点。针对时间序列这个特点,对来自不同领域的10个时间序列数据集,分别使用三种流形学习方法,局部保持投影(Locality Preserving Projection,LPP)、局部线性嵌入(Locally Linear Embedding,LLE)、邻域保持嵌入(Neighborhood Preserving Embedding,NPE)将其维数约简,并对降维后的数据用K-均值算法进行聚类。这三种流形学习方法既可以对高维数据进行维数约简,也可以试图去发现高维数据中存在的低维流形结构。将三种流形学习算法的实验结果分别与对原始数据直接K-均值聚类、使用主成分分析(Principal Component Analysis,PCA)降维后再聚类、使用分段聚合近似(Piecewise Aggregate Approximation,PAA)降维后再聚类的结果进行配对样本t检验,实验显示三种流形学习算法的聚类性能要好于这些方法。(2)基于流形学习的时间序列聚类融合研究。只使用一种聚类算法也许实验结果会不稳定,如今融合多个聚类的结果已成为一种趋势。聚类融合是将多个聚类算法或一种聚类算法通过不同的初始化或参数获得的多个聚类成员使用共识函数进行融合,获得最终的聚类结果。它能比较好地提升聚类算法的稳定性。对来自不同领域的10个时间序列数据集使用LPP、LLE、NPE进行维数约简,降维后的数据多次利用K-均值聚类得聚类成员,将这些聚类成员利用加权投票法进行聚类融合。将这三种算法的结果分别与对原始数据直接K-均值聚类、使用PCA降维后再聚类、使用PAA降维后再聚类的结果进行配对样本t检验,实验显示三种流形学习算法的聚类性能显著好于这些方法。
其他文献
<正>《杭州市中小学校党建工作标准(试行)》在强化责任落实方面做足文章,不仅强化了目标管理、过程管控,还将绩效评估引进党建工作管理中,从而使中小学校党建工作既接天线又
在分析信息消费促进经济增长的途径的基础上,基于2002-2015年我国信息消费水平的样本数据,建立回归模型,通过EViews软件对信息消费促进经济增长的作用进行了实证分析,得出信
信息消费已经成为拉动我国经济增长与消费结构升级的重要引擎,然而在新的信息技术背景下,信息消费的内涵和特征发生了改变。本文在对新兴信息技术发展和传统信息消费的相关研
<正> 小诺霉素目前在临床上用于绿脓杆菌、变形杆菌、沙雷菌引起的感染.眼科也常用治疗结膜炎、角膜炎等.小诺霉素用时不需皮试,方便,很受临床欢迎,但其副作用已有很多报道,
发端于欧美等成熟资本市场的董事高管责任保险公司治理理论日臻完善,但是否适用于处于经济转型期的中国市场仍值得进一步探讨。本文试图从一个逻辑一致连贯的角度,对已有的董
中国古代历朝历代都非常重视乐,经常是礼乐并称,把它作为维护统治阶级政权的重要手段,宋代也不例外。宋代的文艺演出团体分为官办和民办两种,本文就宋代文艺演出团体的不同形