滴滴出行数据实时分析引擎设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ceylong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算和大数据的高速发展,Hadoop和Spark等批量数据处理的平台也就孕育而生。需要先存储再计算的批量处理系统,处理请求有很高的响应延时。但是,由于业务的需求,实时分析也逐渐被提上日程。虽然现在已经有了Storm、Samza和Spark Streaming等流式计算系统,但是由于很多公司针对特定的业务场景各自为政地使用这些系统,因此,就需要一个统一的实时分析引擎,来统一处理各种处理过的或者未处理过的流式数据。实时分析引擎是为滴滴出行数据量身定制的一个系统。该系统采用Java语言开发,以Kafka、HBase、QDB和RedHat为开发环境。首先,对系统进行需求分析,并给出用例图。其次,给出系统的总体架构设计,包括系统层次结构设计和系统模块划分,其中,系统包括四个模块:数据收集模块、数据分析模块、数据存储模块、数据访问模块。再次,分别对系统的四个模块进行详细设计和介绍,包括每个模块的结构设计、功能实现,和每个模块的流程图,以及数据库表的设计。最后,是对整个系统的测试,包括功能性测试,以及采用JMeter进行性能测试和压力测试,验证系统功能是否符合需求预期的目的。系统通过Kafka可以接受来自Storm、Samza和Spark Streaming等流式计算系统的数据,实现公司内部的通用性,同时也整合了资源,极大地降低了重复开发的人力和物力消耗。
其他文献
乡镇是我国最基层的一级政权组织,其对社会发展的作用是其他任何层次领域所不能替代的。要加快社会主义新农村建设,就必须要解决好乡镇机关存在的主要问题。
随着改革的进一步深化,中小企业财务管理越来越受到重视。中小企业的财务管理水平高低很大程度上影响着中小企业的经营发展。因此,完善中小企业财务管理制度,提高企业的财务
近年来,"互联网+"作为一种新兴的商业模式给传统行业的生产经营、运营管理和市场营销等方面都带来巨大影响。房地产行业面临着营销观念落后,渠道单一;营销诚信度低,交易行为
本文说明了工程造价预结算审核的主要目的及重要意义,介绍了预结算审核的内容及步骤,并对审核中存在的问题分析了其原因,最后给出了提高预结算审核质量的一些方法。
根据引黄济津输水任务的要求,在分析工程现状的基础上,从工期要求、工程造价和防渗防冲效果方面分析确定了潘庄总干渠护底方案,以供同类工程借鉴。
人参皂苷Rg1是人参主要的活性成分之一,具有抗炎、抗氧化、抗衰老、抗肿瘤和抗凋亡等广谱的药理活性。人参皂苷Rg1在机体多个组织器官系统中发挥保护作用,这表明人参皂苷Rg1
当今中国,"知识网红经济"发展围绕"价值空间"建构展开,表现出对"知识"的重新定义,包括在"泛中心化"知识分布格局中,价值性知识涵纳事实性知识,并有认知性知识让位于实践性知
《电声》周刊是20世纪30年代上海销量最高的一个电影刊物。它凭借其丰富的内容、公正的姿态以及充满道德意味的批判立场,成为那个时代最具影响力的期刊之一。本文以个案分析