用户画像数据服务系统的设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:joshua0138
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户画像数据的分析和使用对于互联网业务的精细化运营具有重要意义。大量的用户基础信息和行为数据当中蕴藏着待挖掘的商业价值,可以依据这些底层数据给用户在各个维度打上标签,从而全方位地展示用户特征。将运营活动投放给精准的用户群体,可以在很大程度上扩大企业盈利,降低成本。本论文依据互联网公司日常所产生的大量运营数据,设计并实现了用户画像数据服务系统。该系统基于大数据技术进行离线数据与实时数据处理,完成了用户画像标签数据的生产、管理和使用。本文主要完成的研究与设计开发内容如下:(1)用户画像实时检索服务模块:系统主要应用key/value结构数据检索技术,实现了用户标签属性的实时查询功能,并且通过逻辑计算判定某一用户实体是否符合按照一定条件组合所配置的人群规则。(2)人群/地标圈定服务模块:此模块将Spark数据处理技术与Elasticsearch数据检索方法相结合,通过对JSON条件表达式进行解析与转译,实现了依据标签值组合圈定出符合条件的用户集合的业务逻辑,另外,系统平台支持人群创建、分享和删除等管理功能,并且在地标层面具有相同的能力。(3)标签统一收录服务模块:通过优化标签管理与审批流程,完成了规范化的标签体系建设,为集团提供了统一的标签元数据信息收录与管理服务,同时为数据生产过程提供依据。(4)数据生产与监控模块:为了得到满足数据服务能力的标准画像数据,系统在此模块利用Hive数据库和Spark计算引擎实现对离线数据的存储和处理,结合Kafka消息中间件技术、Strom实时计算框架和Tair数据库完成对实时数据的分发、过滤和记录。通过数据质量监控实现对异常生产情况的告警处理。系统服务器端基于Spring MVC和Mybatis开发框架,数据处理过程主要依托Spark作业定时调度完成,结合HDFS、Tair、Elasticsearch、Hive和MySQL完成数据的分布式存储。目前,系统经过测试验证后已经上线运行,在此期间为集团多个业务方提供了统一规范且有效的用户画像公共数据服务。
其他文献
通过文献资料法、问卷调查法、数理统计法等研究方法对上海市社区网球运动的现状进行调查。研究发现,上海社区网球运动存在普及程度低,参与的人群主要是中青年,以男性为主;制
中国公共政策的输入机制是一种内部输入,它是由权力精英代替民众进行要求的体察和认定.内部输入机制的形成是与中国特殊的政策环境有关的.在新形势下单独的内部输入不能适应
<正>创办特色学校或办出学校特色是当前我国深化教育改革的必然趋势,也是学校发展必须面对的问题。如何打造我校教育特色和教育品牌?时代朝天实验小学高举"传承行知文化培育
会议
为了满足微波器件小型化的需要,开发高介电常数的低温烧结微波介质材料成为一种趋势.采用复合掺杂低熔点氧化物来降低BaO-Sm2O3-TiO2系(BST)微波介质陶瓷的烧结温度,通过X射线衍射
针对岩土类材料的变形特点,提出一个描述岩土类材料的各向异性弹性损伤模型。将岩土类材料看成是两种材料的复合体,一种材料的柔度矩阵仅与岩土类材料的弹性模量有关(E材料);
为开发新型廉价高效的析氢材料,用恒电流复合电沉积方法制备了(Ni-Mo)-TiO2复合电极,讨论了TiO2悬浮量和电沉积时间对电极催化析氢性能的影响.用XRD和SEM对电极的晶体结构和表
T型引流管在临床上主要用于胆道狭窄、胆道探查、胆管结石、急性梗阻性胆管炎、胆肠吻合等胆道疾病手术,其目的主要是引流胆汁、降低胆道压力、防止胆汁渗漏感染;同时可促进炎
本文利用制动过程中能量转化守恒的原理,对制动器布置在精密齿轮传动系统输入轴和输出轴两种不同方案所需的制动力矩等情况进行了比较和研究.以表示精密齿轮系统的传动比,研