商业银行大数据分析平台的设计与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:chuai09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
商业银行实际上就是一家大数据公司,未来的一个转型方向是成为数据驱动而非资金驱动的公司。银行的数据属于高度保密的敏感信息,如果利用得当,可以成为银行的一个金矿。在整个企业范围内将数据信息作为资产进行管理和利用,促进企业的创新和转型,我们才能提高银行的竞争优势。商业银行应当如何采集数据、利用数据、自助分析数据、构建独特的竞争优势,开启迈向未来智慧金融的进化之门?这是本课题研究的意义及目的。首先,针对上述背景和问题,本文研究了大数据技术的原理。结合生产需求设计并搭建了基于Hadoop和Spark的大数据分析平台,具备通用性、稳定性,包含了离线批处理、实时流处理等功能。然后,设计并实现了离线计算模块。这部分中首先研究了关系型数据库的数据最佳采集方案;在数据清洗过程中,重点研究了Hive中如何实现数据去重的方法;通过Python实现了HiveQL查询数据仓库的表,然后与Mysql及OLAP结合对外提供数据分析服务的功能,另外还提出了OLAP数据模型优化思路。接下来,设计并实现了实时计算模块。主要研究的是服务器实时日志流进行转换、采集、计算等流程如何实现,重点设计了Flume+Kafka+Spark Streaming的架构以及无丢失获取Kafka数据的方法。此外还详细研究了Spark Streaming中generateJobs实时处理的方法。最后,研究设计了基于ECharts的数据可视化模块,并通过结合JavaScript、Ajax、PHP等技术来具体实现。经过测试,系统的功能和性能符合设计需求。目前,该系统已经在实际生产中开展应用,并取得了不错的效果。
其他文献
在传染病防治中存在着公共利益(公益)和个人权益(私益)之间的冲突。这些冲突的客观存在有其深刻的理论背景。通过“比例原则”在公益和私益之间划出一条法律边界,可以对这一冲突加
运用透射电镜放射自显影技术、液体闪烁计数仪和相关生理指标测定研究了大豆生长过程中不同时期豆荚光合产物对籽粒发育的影响。结果如下:在鼓粒初期、鼓粒中期、鼓粒后期豆荚
回转窑温度的准确控制是保证钼精矿焙烧质量的技术关键.为解决回转窑温度控制超调量大、调节时间长等问题,本文提出了基于专家模糊PID自适应的窑温控制方法,阐述了控制回路的
书法作为中国艺术的典型代表,其中非常重要的独特性在于将阐明德行、精神超越作为艺术的意旨。书写者在点画、线条的笔墨挥洒中,在字法、章法的结构创建中,实现性情的涵养与
报纸
<正>在北京小学,有一个坚持了多年的传统:每年都会给六年级的毕业生集体过一次生日。每一次集体生日活动都是精心准备的,从不马虎,于是,逐渐形成了北京小学的学生文化,而每一
微量注射泵广泛应用于临床医疗和生命科学研究中。旨在开发一套性能优越的自动化送液系统,要求系统具有精度高,能同时联动控制多台注射泵进行加减速注射,且计算机实时控制的特点
针对传染病病原体的现场快速检测对于大规模传染性疾病的及时预防和诊断极为重要,迫切需要小型化便携式病原体核酸检测系统。本文以课题组自主研制的小型化集成式核酸样本检
地震波形反演在近年来得到了广泛的关注,极大地推动了地震勘探的发展,因此对地震波形反演做进一步的研究具有十分重要的意义。回顾地震波形反演的发展历程,分别从理论、方法、实
软测量技术作为一种在线检测技术,被广泛应用于化工过程重要质量指标在线估计研究中,其核心内容是建模方法的研究。人工智能技术被广泛应用于软测量建模方法研究,常用的主要
目的利用超声生物显微镜(UBM)检测白内障患者原发性虹膜睫状体囊肿的发生情况。方法用UBM对391例(426只眼)无外伤、内眼手术史的白内障患者进行眼前段检查。结果391例(426只眼)中,发