面向日志大数据分析的业务服务系统的设计与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jxzsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,各项业务服务为保证健康状况或挖掘深层价值,普遍存在基于相关日志进行分析的场景需求。面对源源不断产生且呈指数增长的海量日志数据,传统的数据处理和分析技术在计算和查询业务上往往无法满足特定性能要求。分布式并行化的大数据技术可充分发挥多机多核的硬件资源,在日志业务分析领域逐渐受到了学术界和工业界的青睐。首先,日志数据通常具有时序性和流式特点,且具有确定的属性意义,其次,在业务流程构建中,业务处理的阶段性和关联性在底层可体现任务流及数据流的对应关系,此外,大数据工程的敏捷开发和生产部署,一直是组织或企业最关心的问题和难题之一。为了对海量日志数据进行高效处理和管理,并快速构建具体业务应用,出于性能和和通用性的考虑,本文基于分布式计算框架Spark设计并实现了面向日志大数据分析的业务服务系统,并着重从如下工作进行研究和设计:(1)根据日志产生、接入和处理特点,对系统架构进行分层构建,并设计了低耦合和支持分布式服务的DSService、SparkServer和MonitorServer三大功能模块。系统通过架构各层、各功能模块及服务间通信和调用方式的设计,支持任务流或工作流管理和调度,并对各服务提供容错性、高效性和扩展性的保障。(2)基于Spark DataSet对大数据批处理和流式处理应用方式进行抽象和统一化设计,形成了数据流和任务流相互对照的业务工作流系统,并实现了支持数据管道建模的统一开发和应用模式。(3)通过提供集成SDK,屏蔽底层复杂操作,并支持服务注册与发现、容灾处理和系统监控,结合管理平台,为用户提供数据接入、开发、部署和可视化的业务应用一体化设计流程,促进数据业务应用的快速集成和实现。根据设计的服务系统,本文通过开展数据接入、任务计算和数据查询三类基准测试,表明系统所提供的大数据基本服务具有较好的性能和扩展性,并在该服务平台上设计和实现了两个具体的业务应用,验证了系统在大数据日志分析业务服务上的通用性和实用性。
其他文献
<正>自从楼市新政向炒房客宣战以来,流动性过剩的"炒作"现象似乎更加泛滥。这不仅表现在黄金上,资金在多个领域的蔓延,让大蒜暴涨、绿豆疯狂、虫草上涨。如今,在"中国三七之
研究唐传奇婢女形象,应将以婢女为独立描写对象的15篇作品作为主要文本,这些作品处处闪烁着传奇作家赞赏的目光。在这赞赏的笔触之下,那些原本生活在社会底层的婢女冲击着读
部分高校公共体育课安全保障工作还没有落到实处,直接影响了大学生的人身安全。采用问卷调查法,对全国43所高校和广西省内部分高校公共体育课的安全保障问题进行了研究,结果
采用简单团簇模型结合密度泛函理论研究了CH3OH在Ga-rich Ga As(001)-(4×2)表面上的吸附与解离过程.计算结果表明,CH3OH在Ga-rich Ga As(001)-(4×2)表面上首先会形成两种化
<论语>蕴涵了孔子丰富的史学思想.孔子对文献谨慎求实的态度、多元化的编撰原则、人物评价的道德标准和通变思想与损益史观,都对中国传统史学产生了深远影响.
体育媒体通过各种大众传播媒介,在商业利益的驱动下,诱惑、挖掘人们最原始的欲望,主张符号消费,宣扬消费主义,涵化大众意识,制造了一轮又一轮的体育文化奇观,成为当今的一大
当前男装设计呈现出复古趋势,对复古的把握和理解有助于设计师在设计中进行合理的融合和颠覆。复古是对文化的传承和尊重,体现在服装中是将传统造型和结构恰如其分地融入。礼
我国从上世纪70年代实行计划生育政策以来,大约少生了3到4亿人,从而为我国解决贫困问题、资源与环境问题等提供了更多的空间。然而,在计划生育实施的过程中也存在着侵犯人权
本人在2年多实地调研的基础上,对荆州市文化旅游产品开发状况进行初步探讨。文章首先概括介绍荆州的旅游规划蓝图与文化旅游产品开发状况,以及取得的业绩,进而细致分析存在的
新修订的2015年版《世界反兴奋剂条例》集中反映了世界反兴奋剂制度的进步和发展,主要表现在它强调了对人权的保护,完善了对兴奋剂违纪行为的认定,改进了反兴奋剂斗争手段,明