基于ELK的日志分析与海量数据检索系统的设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:crazymouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络与信息处理技术的飞速发展使人类进入了大数据时代,数据量呈指数级增长,各行各业都面临海量数据处理的压力。自治区某物联网系统中的应用日志还停留在手工排查阶段,排查日志的效率低下,缺少集中处理与分析,存储在关系型数据库中的海量数据存在查询耗时过长的问题,此外众多服务器的运行监控问题也亟需解决。  为了实现应用日志和服务器指标的分布式采集与实时分析,提高海量数据分析的效率,本文提出了基于ELK(Elasticsearch、Logstash、Kibana的缩写)技术栈的分布式数据实时处理与分析解决方案,结合实际需求设计并实现了日志分析系统和海量数据检索系统。论文的具体研究内容如下:  1.对大数据处理技术进行了调研,对比了主流大数据处理系统的特点和应用场景,重点研究了分布式搜索引擎的核心技术原理,对目前新兴起的ELK技术栈的系统架构、技术原理和使用方法进行研究和实践。  2.针对系统应用日志缺少集中处理与分析的问题,设计并实现了分布式日志分析系统,完成了应用日志的分布式采集、解析、存储与可视化分析工作,解决了传统日志处理方法中的日志处理效率低下、耗时过长、缺少可视化分析等弊端。  3.针对物联网应用服务器缺少有效的监控问题,实现了服务器指标的分布式采集和实时监控,减少了工程师和运维人员的负担,为服务器的稳定运行提供保障。  4.基于Elasticsearch分布式搜索引擎,设计并实现了海量数据检索系统,弥补了关系型数据库在大规模数据检索时耗时较长和缺少全文检索功能的不足。由于Elasticsearch内置分词器、基于词典的IK分词器和Mmseg分词器都不能满足中文地址分词的需要,采用地址要素级别和规则相结合的中文地址分词方法并实现Elasticsearch中文分词插件。  目前日志分析系统和海量数据检索系统已经完成并投入使用。在日志分析与服务器监控方面,实现了日志的实时采集与分析、服务器指标的实时监控,能够显著减少工程师和运维人员的负担,为服务器的稳定运行提供保障。海量数据检索系统实现了亿级数据的高性能检索,并且具有线性扩展的特性,数据处理效率高,能够有效提高数据分析的效率。
其他文献
干扰是影响移动通信网络运行的关键因素,对通话质量、掉话、切换、拥塞均有显著影响。如何降低或消除干扰是网络规划、优化中的一个关键问题。在目前2/3G网络干扰日趋严重并
随着计算机、通信和多媒体技术的高速发展,特别是互联网络的出现和大范围普及,数据图像呈爆炸式增长趋势,使图像资源数量迅速增加,过去基于关键字的分类技术显然不能满足人们
OA(Office Automation:办公自动化)是企业信息化建设的重要组成部分。办公自动化系统的发展恰好与数据、信息和知识的演变同步,即以数据为主要处理内容的第一代办公自动化发展
Android版本的频繁更新是导致Android生态碎片化问题的一个重要原因。为了使Android应用可以在多个Android版本上使用,应用程序开发者不得不为其开发的应用进行兼容处理。然而
SaaS(软件即服务)是近几年新起的一种新的软件交付和商业模式,并且随着云计算概念的提出和普及,SaaS成为了标准的云应用层模型。多承租架构是SaaS型软件的核心实现技术,该架
数控系统中的运动轨迹控制技术是确保数控高速、高精以及高表面质量加工的关键技术,也是评价数控系统性能的重要指标。国内外相关研究机构及各大数控系统开发厂商均将其作为努
电力系统的无功优化是提高电能质量、降低网络有功损耗和保证电力系统经济安全运行的重要措施。随着社会的发展和人口的增加,电力系统的负荷急剧增加,因此对能稳定的应用到更大规模电力系统无功优化问题的新的优化计算方法的研究是有重要意义的。社会情感优化算法是一种新的模拟人类行为的群智能优化算法,本文首先对社会情感优化算法做了具体的描述:为模拟人类能够利用自身的情感准确决策的能力,社会情感优化算法构建了情感集和
在传统机器学习中,为了保证训练得到的分类模型具有高准确性和可靠性,都有两个基本的假设:(1)用于学习的训练样本与新的测试样本满足独立同分布条件;(2)必须有足够可利用的训练样
随着各个行业对计算能力需求的不断增长,云计算得到了迅猛的发展。云计算通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的系统,将大量计算资源统一管理和调
命名实体识别是指识别出句子中具有特定含义的名词,它是信息抽取、自动问答、机器翻译等自然语言处理任务的基础工作之一。手机3D动画自动生成技术由陆汝钤院士于2008年提出,