函数型数据的分步系统聚类算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhqimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多研究和应用领域,数据呈现海量性、连续性等特点。在这种条件下,传统的数据处理方法已经难以满足现今社会数据分析的需要。函数型数据的产生为现代数据分析提供了新的思路,一方面能够有效降低海量数据的存储空间,并且可以借助函数方法对数据进行有效分析。但是函数型数据的研究发展时间较短,各种方法还不是很完善。本文就函数型数据的聚类分析,提出分步系统聚类算法,并对其应用做深入研究。论文首先阐述了函数型数据分析步骤以及常用的聚类方法。函数型数据聚类方法大多从数据的实际距离出发进行聚类,没有体现函数型数据的特点,不能充分利用数据信息。论文针对该问题提出了分步系统聚类算法,给出了函数型数据距离、均值的定义,详细阐述了分步系统聚类算法的具体步骤:首先,利用函数型数据间的实际距离进行聚类,然后,利用函数型数据的导函数距离对结果进一步聚类。为了检验方法的有效性,论文进行随机模拟,并用CR指数将其和传统方法进行了比较。最后,论文将函数型数据的聚类算法应用到实证研究,对世界国家通过人均GDP进行了划分,将结果同真实划分进行对比。根据函数型数据的特点,论文结合聚类分析,提出了函数型数据预测的可行方法,并验证该方法的可行性。随机模拟和实证研究表明,分步系统聚类算法能够在充分利用数据信息的条件下,对数据进行有效划分,在实际应用也体现出良好的应用价值。
其他文献
复杂海量数据往往表现为多种结构特征的混合体 ,回归类混合模型就是对这种混合体的一个描述 .该文基于统计学的有限混合分布理论和可识别性的相关结果 ,针对回归变量的三种情
采用MCT耦合器,基于大气模型WRF、海洋模型FVCOM和第三代海浪模型SWAN,建立了大气-海洋-海浪耦合模型,并将模型应用于台风"威马逊"过程的数值模拟。结果表明,选择合理WRF参数,
“门可罗雀”与“门庭若市”是鲜明的比照,为了改变“门可罗雀”的局面,全区各级档案馆的档案同仁门在研究这个问题,探索解法问题的途径。不管道路多么坎坷,我们总在努力,坚持不懈
2012年5月7日,华硕电脑在北京召开了盛大的发布会,发布了全系列笔记本新品,提出了”Happiness 2.0“用户体验新标准。
在社会经济的背景下,对于通信新技术的应用越来越重要,在综合布线中进行科学的应用,可以有效的推动通信网络的发展。因此,文章根据当前的社会特点,研究分析了几种比较重要的
近年来,在社会经济稳步发展的背景下,各种现代化科学技术也逐步发展起来。而对于人工智能技术来说,是未来现代化科学技术发展的一大必然趋势。随着人工智能技术的出现,在各行
人工岛的建设必须对人工岛建设过程中以及人工岛建成后对周围水环境空间海洋物理、海洋生态的影响进行充分的评估与分析。本研究依托天津港东疆第二人工港岛工程,采用数学模
<正> 香椿树又名椿甜树,因叶有特殊的香味而得名。在我国栽培历史悠久,大江南北20多个省(市),是香椿树分布的中心地带,以前多为零星的材菜兼用栽培。为满足城乡人民生活和外
函数型数据的主成分分析(FPCA)已经成功应用在许多领域,但它主要研究的是单样本问题。本文详细讨论了一种新近发展的函数型数据分析的理论——函数型共同主成分(CFPC)分析方
近两年消费者对家用投影机的关注度越来越高.但真正入手的人却远不及关注的人多,为什么?有几个因素挡在了想要购买投影机的消费者面前:一是安装投影机.在装修初期就需要考虑布线和