基于Spark的分布式实时视频流处理平台的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:a316529455
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的数年中,我们见证了大数据技术的重大变革,为了满足不断增长的数据量和处理速度的需求,大多数企业都将业务迁移到分布式平台上。如今,物联网也慢慢地发展起来,越来越多的智能设备也加入到网络中。从传统的监控摄像、网络视频,到各种智能终端搭载的成像设备,不尽其数的数据源都在产生大量的、有价值的视频数据流。然而,处理如此海量的非结构化数据对于很多企业来说困难重重,更不用说满足用户对于实时性的需求了。针对上述问题,本文在Spark技术的基础上,设计并实现了一个分布式实时数据处理架构,在应对海量视频数据处理需求的同时,为用户提供可靠的实时性。文中涉及到的主要工作如下:首先,设计平台整体架构以及三个子系统的架构,包括视频流ETL系统、分布式实时视频流处理引擎以及分布式文件系统。其次,实现视频流ETL系统,包括抽取、转换和加载。针对视频流的特点,使用Kafka消息队列解决视频数据的分布式加载问题。之后,基于Spark实现分布式实时视频流处理引擎,提供三种实时处理的方案,并使用人脸识别的案例,将图像视觉处理技术应用于实时处理中,从理论建模和实践的角度去探索实时视频流处理的可行性。我们的平台还允许实时处理和交互式查询相结合,从而产生更丰富的应用。最后,本文实现了两层架构的分布式文件系统,包括磁盘级的HDFS和内存级的Tachyon,使用分布式内存文件系统Tachyon作为底层文件系统和计算引擎之间的中间层,将内存管理和数据计算分离开来,使得平台拥有更高的执行效率。
其他文献
黄帝陵是中华民族的祖陵胜地,也是我国的宝贵财富和文化遗产。黄陵历史城市营建与黄帝陵息息相关,因陵而生,依陵而建,具有独特的人居环境营建经验。根据史料解析,提取嘉庆和
本文回顾了近年来日本旅游地理学的研究工作并明确了其未来的任务。在总结了日本旅游活动的历史和特点的基础上,把旅游地理学研究归结为空间组织的研究、景观彤成的研究和其它研究(包括景观评价和旅游资源的认知研究等)三类。在空间组织的研究中,地理学家已经探讨了以城市为中心的旅游空间和由不同类型旅游地所构成的复合旅游区。然而进一步发展城市旅游地理研究,对于探讨旅游空间问题是十分蘑要的。有关景观形成的研究工作比空
毕业实验是工科专业毕业设计的一个重要实践环节。新冠肺炎疫情缩短了工科毕业实验周期,限制了学校实验资源的利用,影响工科学生毕业设计质量和就业能力。此文根据社会实验资
目的:探讨汉族、维吾尔族抗结核药物导致的肝损害患者血清TNF-α的表达情况,比较两民族间的遗传差异,并分析TNF-α表达量与肝损伤程度的关联及其临床意义,以期探讨细胞因子TN
<正>0引言目前全球经济进入全新发展阶段,技术进步成为经济发展的决定性因素之一。本文重点研究了国内外技术引进的相关经验和启示,针对广东省技术引进的实际情况和存在问题,
针对某电站凝结水升压泵组电机空载以及带载振动超标的问题,进行了电机振动故障的排查与诊断,通过灌浆、增加垫片、调整螺栓、增加夹具等措施,保证电机振动在合格范围之内,有
教学质量直接影响着高职院校的教育水平,关乎着学生在校学习的效果以及走向社会就业的能力。此文阐述了课堂教学诊断的观测点及方法,探讨了课堂教学的改进方法,以及时弥补教
中国制造业存在一定程度的要素价格扭曲,要素价格扭曲程度的差异化较大:第一,大部分行业的劳动相对扭曲系数都大于1,制造业普遍存在着劳动力价格扭曲现象,经济发展一直以牺牲
从发展中国医疗卫生事业、强健国人体魄的愿望出发,该文阐述了中医护理理念的内涵和西医护理理念的内涵,分析了二者之间的相同之处和不同之处,并提出了创新中国特色护理理念
资源型县域的经济发展,对当地资源的依赖性极强,较为单一的产业结构特征明显,是阻碍经济可持续发展的重要因素,产业转型显得迫切需要。L县作为我国资源型县域的典型代表,煤田