一种基于Kafka的数据采集与实时处理系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fw1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网行业的迅猛发展和居民生活水平的提高,人们对生活的安全感和环境的质量要求越来越高,越来越多的人们选择非机动车辆出行,大家都希望生活在文明有序、平安和谐的环境中。与此同时,各地政府部门都在推进“互联网+”建设,提高监管服务效能。论文选题来源于“城市车辆智能防控系统”项目。系统通过给每辆电动车发放电子车牌和在各区县主干道安装传感设备的方式,来采集城市电动车的信息,解决城市电动车辆的监控、管理和被盗追查等问题,为某市公安局提供城市电动车辆的统一管理。由于区县内电动车数据接收量越来越大,因此车辆数据接收和实时数据处理成为当前项目中的一个难题。本论文针对“城市车辆智能防控系统”项目中数据接收量越来越大,导致数据处理中存在响应延迟、数据丢失以及过高的内存负载等问题,利用Kafka具备的高可靠性、异步通信和横向扩展能力,以及Netty减少资源消耗、充分提高资源利用率的能力,和Spark Streaming对数据进行快速分析并实时响应的能力,对数据采集及数据处理模块进行优化,实现一个具有高可靠性、低延时性的数据采集与实时处理系统。本文通过对现有项目背景和相关技术的分析,主要工作内容如下:(1)系统需求分析。对平台系统进行建模,分析数据采集与实时处理系统的需求,总结得到系统的功能性需求和非功能性需求。(2)系统设计与实现。结合系统需求,设计数据采集与实时处理系统的总体架构。首先,使用异步通信框架Netty实现数据记录的接入和解析;接着,基于Spark Streaming实现数据采集器的状态维护、重点对象布防与实时报警等功能;最后,利用Hbase和Redis完成数据记录的存储以及热点数据的缓存。(3)系统测试。部署系统测试环境,完成系统的功能测试,并在数据接入、数据压缩和处理时间等多个维度对比分析原有系统和本文系统的差异。经过系统测试,本文系统实现了终端设备状态检测、基础设备更新和布防报警等功能。同时,系统数据压缩率相比原有系统提高了33%,数据入库消耗时间低于5s,且可保证1000台机具的稳定接入,满足了高并发接入指标,达到用户提出的系统性能需求。测试结果表明,本文系统在数据接入、数据压缩和处理时间等多个维度均优于原有系统。
其他文献
在高压输电过程中,需要借助大量的输电导线以及金具。耐张线夹作为连接导线的关键性金具在服役期间皆暴露在空气中,在环境和线夹温升的共同作用下且易发生腐蚀而导致线夹破坏
在典型工程的地基加固方案优化设计中,采用有限元分析法,对天然地基上的筏板基础、短桩加固、长短组合桩加固、长桩加固等方案进行系统计算与分析。作用相同荷载时,短桩加固
在民国初期,西藏地方和中央的关系处于多事之秋,在这种情况下,西藏在内地供职的佛教僧人的作用就显得更加突出,成为双方保持联系的重要桥梁和渠道。民国时期曾经在北京、南京供职
<正>长期以来在思想政治理论课教学中,片面强调学生在知记、背诵、复现过程中掌握知识,忽略运用现代教学手段、教学方法调动学生思维的积极性。教师对学生的学习主体地位认识
东北地区地处中温带气候,冬季寒冷漫长,春季干旱少雨,因此,早春解冻是东北地区苗木移植的适宜时期。虽然我省多数地区对春季苗木移植工作已经做了较大投入,但受到苗木养护管
目的:探讨不同糖耐量人群负荷后1h血糖与炎症因子的关系。方法:受试者分为4组:2型糖尿病(Type 2 diabetes mellitus,T2DM)组,糖耐量减低(Impaired glucose toleranceI,GT)组,正常糖
目的:探讨分析流动人口孕妇的社区管理策略和效果。方法:把2012年3月至2014年5月到我院实施产前检查的60例流动人口孕妇作为本次研究对象,对其实施社区综合性管理,对比分析管
介绍了我国浸渍剂沥青开发试制进展和几种浸渍剂沥青的生产工艺,简明分析了每一种生产工艺的特点.根据国内外浸渍沥青的生产和使用情况,对加快我国浸渍剂沥青研制,尽早实现工
目的观察染料木黄酮对人非小细胞肺癌PC14细胞增殖的影响,并探讨其作用机制。方法MTT法及集落形成实验检测细胞增殖;蛋白质免疫印迹检测蛋白表达水平。结果染料木黄酮能显著
详细分析了光照强度、水分、CO2浓度、温度、矿质元素对树木光合作用的影响规律指出了这些环境因素的变化对树木光合作用的主要影响表现。