基于云原生架构的实时ETL平台的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:bigtree16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,在大数据和云原生技术的背景下,不少传统企业都对内部进行数字化改革。同时企业内部存在着不同部门之间的数据互不相通,无法得到有效的利用的问题。随着业务的发展,数据的积累也就越多,部门之间存储数据的数据库类型也越来越多,需要解决异构数据源之间的数据同步问题,在一些业务场景中,对数据处理的延迟有着严格的要求,这就需要做到实时在异构数据源之间同步的工具。针对上述问题,本文实现了一个基于云原生架构的实时ETL平台,该系统以联通各个孤立数据源为目标,结合实际业务情况,基于云原生、实时采集、大数据处理等技术,着力解决企业内部异构数据源数据的联通问题,并且提供了对数据实时处理的能力,建立了平台监控运维智能化的体系,采用灵活扩展的架构,方便系统的开发扩展。论文的主要工作如下:根据企业职能人员的需求进行需求分析,对需求进行细化分析。确定系统与外部系统的边界并明确系统内数据流向。对系统的主要功能模块进行分解,分别使用UML用例图的方式描述系统中的任务管理、数据资源管理、用户与权限管理和监控管理等主要功能模块需求,同时确定了系统的非功能性需求。对实时ETL平台进行架构设计并实现各个功能模块。使用Kafka Connect技术实现数据实时的从源数据库的抽取,然后用Flink实现对数据的计算处理。在数据处理过程中使用Bloom Filter算法对处理数据进行去重统计。在搭建监控告警模块的基础上使用改进Louvain社区发现算法对告警记录进行分析,挖掘出告警事件之间的关联关系,将告警事件分为多个社区,为告警的根因分析做准备。在系统设计实现方面,采用Spring Cloud框架,用微服务的方式构建系统,并详细描述系统各个功能的设计实现过程,根据需求分析设计出系统数据库中的物理表。在实现完成整个系统后,根据需求设计各个功能的测试用例,将系统部署到运行环境后,对主要功能按照需求分析的用例进行测试。系统性能测试分别对主要功能的响应实现测试,对实时ETL的性能、并行数量和数据处理延迟分别进行测试,最后对功能模块中使用到的算法进行测试。经过完整的系统测试验证了系统各个功能的符合需求,性能上也满足需求中的要求,可供企业用户正常使用。
其他文献
近几年来,随着高速网络和云计算技术的不断进步,云游戏逐渐走入大众的视野,引起了人们极大的兴趣和关注。相较于图形流和混合流,视频流方法凭借其较稳定的数据压缩方式和较低的游戏设备性能要求,成为了目前主流的云游戏实现方案。然而,网络传输数据量大、对时延敏感等问题仍是限制基于视频流的云游戏技术发展的重要因素。针对视频流方法中的数据传输量大、编码效率不够高的问题,本文实现了基于视频流编码优化的云游戏系统,并
学位
阵列天线包含电源、T/R等众多的功率器件,而目前国内T/R组件的效率只有30%左右,当雷达系统工作时,天线阵面密布的T/R组件会产生大量的热耗散。T/R组件对温度很敏感,热量的不断累积会使得T/R组件温度过高、温差过大,这些都对天线的电性能产生严重影响。相控阵天线向着远距离探测、高集成度方向发展,内部热流密度会越来越大,而现有成熟的冷却方式由于从热源到终端热沉之间隔着众多的封装材料,从而限制其散热
学位
近二十多年是移动通信飞速发展的黄金年代,无论是2001年挥别1G拥抱2G还是现如今低时延、低功耗、高可靠的5G通信也逐步在我国普及开,这无不得益于无线射频收发技术的进步。锁相环频率综合器能通过反馈系统迅速调节振荡器产生高频率、高精度的本振信号,在许多射频收发系统中扮演着极为重要的角色。目前,得益于CMOS工艺的特征尺寸不断缩小,全集成射频收发芯片在众多无线通信产品中被广泛应用,相应地,更高性能的锁
学位
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)具有全天时、全天候、远距离对非合作目标进行高分辨二维成像的能力,可以获得观测目标的形态结构等信息,在军事和民用领域都得到了广泛的应用。ISAR成像的基本理论经过多年的发展已经较为完善,当观测目标回波信噪比较高时可以获得聚焦良好的成像结果。但是,随着ISAR观测距离的不断增加,观测目标ISAR回波的信噪比不断
学位
单纯性肠梗阻可归属中医“关格”“腹痛”“肠结”范畴。谢晓华教授在气滞血瘀、肠腑热结、气阴亏虚的传统辨证思想基础上,认为单纯性肠梗阻的病位在肠腑,与肺、脾胃、肾、三焦等脏腑相关,病机与津液代谢失常密切相关。其治疗需在通腑、扶正、祛邪的基础上,重视“调水道,行津液”。治疗原则需以通腑、调气与利水并重,兼以扶正、祛邪。单纯性肠梗阻禁食阶段采用针刺治疗以助津液通调,选穴以曲池、小海、梁丘、足三里、血海、阴
期刊
随着计算机和网络通信技术的迅猛发展,音视频多媒体数据正按几何数量级增加,人们对快速准确查找到目标音视频提出了更高要求,音视频内容研究也成为了人工智能领域的热点。尽管人工智能技术对音视频的理解与分析需求是多种多样的,但对音视频数据信息的标注需求是一致的,音视频内容的标注具有普遍性。随着人工智能逐渐从理论向市场落地,场景化的要求也日益增长,对使用场景也愈趋渐碎片化,越来越多的小团队加入了人工智能模型的
学位
传统天线小型化设计面临三个原理性难题:尺寸微缩难(大于?/10)、阻抗匹配难(镜像电流反射)、辐射效率低(电流欧姆损耗),其根源在于传统小型化天线基于电磁谐振的工作机理,天线的性能仍然受到Chu-Harrington极限限制。磁电天线概念的提出,为天线小型化设计提出了一种全新的解决方案。磁电天线由压电材料与磁致伸缩材料组成,磁性材料可感应电磁波的磁场分量并转化为声学波,以电压形式输出;反过来,压电
学位
目的:观察平胃散加味内服联合芒硝外用治疗晚期肿瘤不全性肠梗阻(MBO)的效果。方法:62例按随机数字表法分为两组各31例,对照组用西医对症治疗,治疗组用平胃散加味口服联合芒硝外用治疗。结果:总有效率治疗组高于对照组(P<0.05),持续性腹痛、绞痛、恶心及呕吐积分治疗组均低于对照组(P<0.05),腹痛缓解时间、恶心呕吐缓解时间、排气排便恢复时间、肠运转功能恢复时间、经口进食恢复时间治疗组均短于对
期刊
可信计算是以硬件安全机制为基础,建立可信赖的执行环境,对系统内的数据进行验证和保护的一种安全技术。完整性度量是可信计算平台最核心的组成部分。完整性度量可以检测出操作系统中正在加载的程序或者执行组件是否完整,并且可以检查出运行平台本身或其启动过程是否被篡改。Linux已经发布的IMA版本仅提供对用户态可执行文件的静态完整性验证,不具备实时检测内存状态的能力。后续的一些研究通过引入访问控制策略、结合信
学位
空时自适应处理技术是机载相控阵雷达的核心技术,具有优越的杂波滤除能力和抗干扰能力,这为雷达对抗方带来了极大的挑战。因此,本文针对空时自适应旁瓣干扰技术进行了研究。主要工作内容包括:1.对空时自适应处理技术的相关基础理论进行了介绍。建立了相控阵雷达天线几何模型与空时自适应处理信号环境模型。介绍了STAP全空时自适应处理算法和m-DT、JDL两种降维空时自适应处理算法。对三种算法进行了仿真对比实验,结
学位