对时间序列的基于模型聚类的探讨

来源 :中山大学 | 被引量 : 0次 | 上传用户:wowo925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列方面的数据搜索和数据挖掘聚类问题应用是近几年来的热门问题之一,它广泛运用于各方面的研究。比如说:商业领域、社会经济、科学研究、艺术和环境、能量、医学等。目前国内外处理时间序列聚类的方法主要有三类:一类是基于原始数据的方法;一类是基于特征提取的方法;另一类是基于模型的方法。本文选择基于模型的聚类方法:先求出时间序列的AR模型,然后计算模型系数的LPC(Linear Predictive Coding),再计算LPC系数的欧氏距离来确定模型之间的不相似性,根据这个不相似性来对时间序列进行聚类。本文尝试了各种聚类方法,其中基于LPC系数的CLUSTER聚类算法使用SAS系统的现成模块,而自己编程实现了两种聚类方法:k-means方法与W-k-means方法。聚类实验先在人工数据集上进行,说明LPC系数的有效性,再用1929年-1999年美国25个州平均个人收入的数据做实验,并与传统方法作比较。实验结果表明:基于LPC系数的CLUSTER聚类算法结果稍差,基于LPC系数的k-means聚类结果比传统聚类结果好,而基于LPC系数的W-k-means聚类结果又比基于LPC系数的k-means聚类结果更进一步。
其他文献
让孩子学得轻松快乐,为了与零书面家庭作业融合起来,需要我们去思考、去实践.活用生活资源,善用自主实践、巧用学科联系……
本文利用H(t,s)型函数和广义Riccati变换技巧,给出二阶非线性时标动态方程(p(t)x(t))+f(t,x(σ(t)))=0新的Kamenev型和区间振动准则。 第一章为综述,简单介绍时标理论的发展、
本文的研究内容主要有四个部分:可积方程多孤子解的Pfaff式表示、寻求孤子方程,特别是非等谱方程的耦合系统、高维可积方程的可积离散化、用符号计算软件Maple求可积方程族的贝
学位
在本文中,我们考虑了流体力学与材料科学中的两类自由边值问题。一个是气体向真空扩散的自由边值问题,另一个是剥脱现象中产生的自由边值问题。自由边值问题经常出现在我们的生
信用评级是一种比较模糊的概念。本论文在参考国际先进评级模型的基础上,分别建立了定性分析模型和定量分析模型,结合两方面的分析结果划分信用等级。具体内容如下: 第一部分
为了更好地理解Kac-Moody代数g(A),我们研究了一类对应于广义Cartan矩阵A的李代数(o)(A)(我们称为变形Kac-Moody代数)。李代数(o)(A)具有比Kac-Moody代数更简单的结构,但是它们
学位
本文利用Hopf代数的有关理论分析了三类不同的Hopf代数的构造,主要介绍了代数上的余自由不可约Hopf代数CH(U)及其Shuffle代数,通过分析两-者结构之间的联系,在当U为有限维时,对CH
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
种群模型是生物数学中最重要的分支,各种各样的捕食模型具有广泛的生物意义.对捕食模型的研究一直深受广大学者们的关注,研究角度也各不相同.利用非线性分析的理论,可以得到
数字水印作为传统密码学的补充与完善,在版权问题上发挥了重要作用,因此是当前国内外信息安全领域研究的热点。研究数字水印技术主要围绕水印的特性展开,水印的稳健性是一个水印