探索性数据可视化分析系统的设计与实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:oldbuck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,人们在日常生活中接触到的数据正在以惊人的速度增长,数据已经成为人们生活中的重要组成部分,如何对海量数据进行有效的分析和处理已经成为当下的研究热点。数据可视化技术通过将数据映射为图形、符号和颜色等,能够直观展示数据内部隐含的信息,为人们对数据做进一步分析和处理提供了参考思路,是大数据分析不可或缺的重要手段和工具。可视化方法可以大致分为两类:探索性可视化与解释性可视化。前者的目标是在数据处理初期阶段,借助可视化图表帮助人们在杂乱的数据中发掘数据的内在联系;后者是在视觉呈现阶段,将已知的信息或知识以可视的方式传递给公众。针对海量未经加工的原始数据,提供一个能够对其进行数据转化与可视化分析的平台十分必要。结合这一背景,本文面向普通用户设计并构建了一个支持数据接入、数据管理、数据转换、数据可视化等完整功能的通用探索性数据可视分析系统。本文的主要工作包括以下几点:(1)对数据可视化流程、可视化编码技术、Spark相关技术进行概述,为系统的设计提供理论基础。(2)从需求分析入手,提炼了系统的主要功能。在此基础上对系统划分为项目管理、数据集服务、数据集转换、数据可视化、用户操作五个模块。(3)基于B/S模式对系统进行架构设计,选用Play! Framework2作为Web服务框架。采用MVC的思想将系统划分为展现层、控制层、业务逻辑层、数据访问层、数据层、加速层,并对各层中使用的工具进行简要介绍。考虑到对于海量数据的处理需求,加速层引入分布式计算框架Spark作为数据转换、数据查询的引擎;数据层使用分布式文件系统HDFS存储数据集文件。(4)设计各模块业务流程,实现模块功能。以活动图阐述模块功能的工作流程,以时序图的形式展现模块的运行逻辑与对象关系。(5)对系统进行功能测试以及关键功能的性能分析,针对目前系统中热力地图在大数据集下绘制能力的不足,提出了一个结合GeoHash算法的优化方案,并对方案进行验证分析。优化方案在一定程度上减轻了前端热力地图绘制的压力,并具有良好的绘制效果。
其他文献
为了能够达到对危险废物处置资源化、减量化、无害化的目的,通过有机溶剂无水乙醇对吸附有饱和二异丁酯(DIBP)的脱色活性炭,能否进行置换与脱附再生回收进行了实验研究。将来自生
以偶氮二异丁腈为主要原料制备了2,2’-偶氮二(N-环已基异丁基脒)盐酸盐,研究了2,2’-偶氮二异丁亚胺甲醚盐酸盐及2,2’-偶氮二(N-环己基异丁基脒)盐酸盐的最佳合成工艺条件。以1,2-二
通过北斗卫星系统对配网运行状态进行全面实时监控,可解决配网智能化建设进程中存在的时间不同步、缺乏有效地理信息、无法保障通信安全等一系列问题。文章创新性地将北斗卫
计算了福建160000m3 LNG储罐罐底、罐壁和罐顶的漏热量,根据储罐的日蒸发率估算了储罐的许用漏热量。通过对比计算储罐漏热总量和许用漏热量,分析了储罐的保冷性能。所做的研究
综述了有机磷阻燃剂DOPO及其衍生物的研究进展,介绍了DOPO及其衍生物的合成方法及其在环氧树脂、聚丙烯、聚氨酯、聚碳酸酯、尼龙等方面的应用,并对DOPO及其衍生物的应用前景进
靠氢键作用结合的硫脲催化剂因其良好的催化活性而受到广泛关注,被应用于各种不对称Michael加成反应中。本文主要介绍了硫脲催化剂在催化硝基烯烃的Michael加成反应中的研究现
无论对旅游资源盲目开发或者过度开发导致的资源破坏等恶劣环境影响,其根源都在于对生态旅游区游憩资源价值没有正确足够的认识。陕西生态旅游业是全国生态旅游发展的缩影,既
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
碳纤维是一种新型无机纤维材料,具有很高的强度与热稳定性,同时具有双电层电容特性,可应用于高强度耐高温类超级电容器电极基体材料的制备。通过SEM、Raman、XRD、电化学工作站