【摘 要】
:
随着互联网数据规模的急剧膨胀,以及服务类型的复杂多样,各类企业的运营业务逐渐由单机的系统转为分布式应用软件系统来承载。与此同时,系统运维的复杂度也呈指数级上升,大量
论文部分内容阅读
随着互联网数据规模的急剧膨胀,以及服务类型的复杂多样,各类企业的运营业务逐渐由单机的系统转为分布式应用软件系统来承载。与此同时,系统运维的复杂度也呈指数级上升,大量分散的日志不易管理,人工检索日志中的关键异常信息效率太低,并且遗漏的可能性较大,导致大量有价值的日志信息没有被充分利用。本文正是针对当前分布式应用场景下的运维痛点,设计并实现了一个适用于分布式应用软件的日志分析系统。从分散日志的统一收集、存储和日志分析以及分析结果的可视化展示,将日志分析系统分为日志聚合和日志分析两大模块。日志聚合模块包括日志收集、消息队列、分布式存储三个部分。日志收集使用了开源组件Flume,并结合实际场景对其中的Channel组件进行了扩展,开发了自定义的通道DoubChannel,实现了内存通道和文件通道的自由切换。日志分布式存储使用了基于Lucene开发的分布式搜索引擎Elasticsearch,为日志分析模块提供更好的数据服务。在日志收集和存储间使用了Kafka消息队列缓存数据,避免出现由于数据洪峰以及两端处理速度不匹配问题造成的性能问题。日志分析模块包含在线任务管理、日志聚类分析、相关性分析和异常场景分析四个部分。在线任务管理负责整个日志分析模块的启停管理。日志聚类分析从Kafka中获取实时的日志,使用IPLoM和DBSCAN两种算法相结合提取出日志模板,生成日志模板库,并实时更新。相关性分析首先从Elasticsearch中获取指定类型的日志和日志模板库进行匹配生成日志分布基线,其次使用分箱算法、分位数算法和KSigma模型根据模板库和分布基线分析实时的日志数据,得到实时的窗口数据。异常场景分析通过分位数算法和LCS算法对连续的异常窗口进行异常标记识别和故障判别。系统的可视化部分对日志分析统计结果和详细信息给出了清晰的展示。经过功能测试和性能测试表明,系统能够快速发现异常并进行故障判别、给出故障根因和应急预案,能够帮助企业实现便捷的运维工作。
其他文献
介绍了美国应急管理机制、应急机构设置与分级管理经验,美国洪水保险制度,飓风实时监测与预警预报系统,应急文化建设,开展防灾避险宣传演练教育等方面的经验。根据深圳市在大
经典连续体力学理论假定材料介质是连续和均匀的,这一特性从宏观一直细分到微观保持不变,不考虑材料的具体微观结构。但是,由于材料中不可避免存在夹杂、晶格和微裂纹等微缺
<正>2018年云南省两会期间,诞生了一个热词:三张牌。即"绿色能源牌""绿色食品牌""健康生活目的地牌"。在云南绘就发展的七彩新画卷中",绿色",成为其最亮眼的底色。无论是代表
一些本身具有不确定性的事项,比如公司资产重组、业绩预测、意向性项目或者供货框架协议等,成为信息披露义务人误导性陈述的绝好载体。之所以选择这些作为载体,是因为这些事项本
石墨烯(graphene)的成功剥离打开了二维材料研究领域的大门,其在电学、光学、热学和力学等方面的独特物理化学特性和巨大的应用前景受到了研究人员的广泛关注。十几年来,众多
<正>一、教材分析《风筝》是鲁迅先生的散文诗集,《野草》中的篇章之一。文章以风筝为线索,通过对风筝事件的叙述,深深地批判了封建旧式教育,作者对粗暴对待小兄弟的言行,作
随着社会的进步和教育的改革发展,幼儿教师专业发展越来越受到社会的广泛关注,幼儿教师的实践智慧成为近年来教育研究的热点问题;创造性游戏是幼儿典型的游戏形式,能够促进幼
目的为研究三叶木通种质资源遗传多样性,建立并优化三叶木通AFLP反应体系。方法以三叶木通叶片为材料,对影响AFLP反应体系中连接、预扩增和选择性扩增的各因素进行分析,建立
儿童承载着家庭的希望与祖国的未来,本应该得到社会的关照与呵护,在阳光下沐浴成长,但是,近年来一则则关于儿童遭受家庭暴力的新闻冲击着人们的视野,家庭暴力给儿童的身体和心理都造成了巨大的影响。随着虐童案件的持续报道,家庭暴力越来越受到社会的关注,我国也于2016年正式实施了《反家庭暴力法》,但由于儿童自身能力弱、对家庭依赖性大的特点,以及传统思想给人们留下的固式思维,导致暴力事件发生时,受害者很难及时
<正>党的十九大报告提出,要增强改革创新本领,善于运用互联网技术和信息化手段开展工作。习近平总书记曾经强调,"我们过不了互联网这一关,就过不了长期执政这一关"。2016年,