论文部分内容阅读
统计数据通常包含空间、时间和属性信息等多维特征,可以从不同角度描述数据潜在的环境以及所处的状态。且随着中国经济与社会的高速发展和信息采集过程的规范化,越来越多的统计数据被存储和记录下来,更为全面而细致地反映当前社会的经济发展情况和人类的社交模式。对具有多维时空特征的统计数据进行有效的分析,有助于民众直观地了解国情,辅助学者对经济形势进行分析与研究,协助相关职能部门制定政策,具有重要的理论意义和实践价值。然而,统计数据具有属性多元化、时空层次化等特点,传统的统计分析方法在分析多维时空统计数据时无法发现数据间的复杂属性关联模式以及时空动态演变规律。因此,构建一个可以帮助用户简单而高效地探索多维时空统计数据的分析方法变得尤为重要。可视分析作为一门跨学科的领域,集成了数据挖掘、模型分析等多门学科的理论和方法,并采用交互手段允许用户根据特定的需求,交互控制数据的抽取和画面的显示,帮助人们更为直观的洞悉数据背后的信息。本文旨在利用数据可视分析方法面向统计数据的多维时空特征展开相关研究。本文的主要创新点如下:1.面向统计数据的多维属性,提出一种基于聚类的平行坐标轴排列可视分析方法。采用层次聚类算法对统计数据的多维属性进行聚类分析,结合信息熵度量属性间基于聚类的相关性大小,并通过MDS投影和相关矩阵图可视化展示属性间的相关关系,最后通过最优路径规划得到一个基于聚类的平行坐标轴排列顺序,并在平行坐标视图中可视化展示。通过三个多维统计数据的实际案例分析,验证该算法以及所设计可视分析工具的有效性和实用性。2.面向统计数据的空间多维属性,提出一种能有效融合地图和平行坐标的动态平行坐标轴排列可视分析方法。综合考虑空间属性和多维属性,设计可以有效识别空间聚类特征的空间多维属性聚类分析算法,引入Voronoi图和颜色映射对空间聚类结果进行特征表示,并对多维属性进行核密度聚类,引入互信息作为度量空间聚类和属性聚类间相关关系的标准,在平行坐标中动态嵌入地图视图,并优化平行坐标轴排列顺序及数据线的空间分布。通过可视分析案例和专家反馈证明算法在增强多维属性空间分布及关联特征的视觉感知方面有明显的优势。3.面向统计数据的时空多维属性,提出基于NMF模型的时空聚类算法,从而对城市进行功能区划分。首先定义时空出租车OD数据的空间粒度和时间粒度,构建时空矩阵。结合NMF模型将具有相似时变模式的空间区域聚为一类,以此构建城市功能区。并设计大量的可视化视图,使用户可以快速识别城市功能并捕捉感兴趣的城市功能区内,或城市功能区之间的相互关系和具体车流量模式。通过大量的案例分析和用户反馈验证该城市功能区划分方法的有效性和实用性。