基于海量数据的用户行为数据分析系统研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:dfdfdfdfgdfdfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业的发展,人们的生活越来越离不开互联网带来的便利,政府对互联网+的支持,造就了众多传统行业与互联网的融合,这种融合不仅改变了行业的发展模式,同时也产生了海量的数据。人们每时每刻在互联网上产生的行为都被格式化的数据记录下来,这些行为数据对分析用户行为、改善服务价值、预测购买意愿及舆论走势具有重大价值。在互联网行业中,每天都会产生大量的行为日志数据,动辄以TB为单位,如何更好、更快、更准确的收集、处理、存储及展示用户的海量行为数据成为迫在眉睫的需求。在用户行为领域,通过数据分析方法的科学应用,经过理论推导,能够相对完整地揭示用户行为的内在规律。基于此帮助企业实现多维交叉分析,帮助企业建立快速反应、适应变化的敏捷商业智能决策。利用用户行为数据,可以产生更加优质的服务,这对任何一个组织来说都是绝对有意的。海量用户数据从产生开始,需要经过多个数据处理阶段才能通过云服务的方式向分析决策人员提供决策参考价值,或者直接向高层提供决策数据的方案支持。如何将海量、异构、实时、多样的用户数据进行高效采集、处理、存储,以实现大规模复杂用户数据查询的快速、准确、及时响应成为具有重要价值的研究方向。用户行为数据的价值随着时间逐步被挖掘,用户行为数据的重要性被广泛认可。本文从系统的角度,分析行业内用户行为数据分析系统的方案与技术,同时根据现有新兴技术的优势及特点,提出一套能够满足海量用户行为数据分析的系统方案,该方案是一套完整的解决方案,涵盖数据采集接收、数据处理、数据仓库、数据分析及数据可视化。本文主要研究和完成的工作包括:(1)建立完善的数据采集接收子系统,包括数据收集的策略、各种异常问题的解决方案、系统的扩展性设计等。(2)构建数据处理链路,通过对不同了来源的行为数据进行日志格式的预处理、清洗,产生符合标准计算的数据。(3)构建用户行为数据仓库,将处理后的数据根据业务等需求,将多来源的用户行为数据相互整合,形成不同产品的用户行为数据仓库,并将其作为用户行为数据分析系统的核心数据。(4)构建用户行为数据分析平台。根据业内对用户行为数据分析的价值判定,提供包含事件分析、漏斗分析、留存分析、用户路径等算法的快捷用户行为数据分析模板和数据可视化方案;除此之外,保留为用户提供的自主分析方案,使用户可以自主分析用户行为数据,挖掘数据价值。依照本文的设计方案构建的海量用户行为分析系统已经在国内最大的网约车互联网公司部署使用,该系统采用完全开源和自编程系统,最大化的保证数据在各个子系统之间的传输的可靠性。海量用户行为数据分析系统采用主流设计思想和较为先进的技术,保证系统的完整性和可扩展性,提供一个简单、迅速和规模化的数据分析产品,能极大地简化分析流程,提交效率,直达业务。该系统从设计到使用经历长达一年设计、开发,现在已经为用户行为分析的分析师和决策者提供稳定、准确、及时的数据支持。
其他文献
拉萨中学科技创新活动由单一科技兴趣、创新发明阶段逐渐发展到STEAM项目学习教育阶段。把STEAM教育的研究方法和形式整合到本校科技创新实践活动中来,根据民族地区的实际情
设计了一种具有十连杆五自由度的可控机构式焊接机器人,并针对可控机构低重心的特点以及焊接过程的实际工况,通过ADAMS软件对机器人机构进行刚性体和柔性体的建模,在直线匀速
<正> 颈性眩晕是因颈椎退行性病变所致,多见于椎动脉型和混合型颈椎病患者,是临床常见病和多发病。笔者采用穴位注射疗法治疗颈性眩晕65例,疗
自古以来,人们就在不停地寻找长寿的药方。最近,俄罗斯科学家确信他们找到了这样一种药方,这种药方不仅能让人长命百岁,甚至有望让许多人活到140岁。这种药方藏在遥远的西伯
<正> 近两年来,连云港港摆脱了吞吐量曾一度下滑的局面,开始了持续上升的新的历史阶段。1997年全港吞吐量比1996年增长4.27%。而1998年,该港克服亚洲金融危机的影响,在全国沿
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield