基于用户画像的个性化新闻推荐系统的设计与实现

来源 :首都经济贸易大学 | 被引量 : 3次 | 上传用户:jiba00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据和机器学习时代,以新闻资讯为基础的互联网应用产品迅猛发展,用户进行新闻阅读的途径越来越多,带来了新闻资讯的指数爆炸式增长。这些海量的新闻资讯在满足了我们日常需求的同时,也使我们寻找所需的新闻资讯更加困难,对用户数据的采集以及新闻的合理推荐成为了各大新闻网站和APP的重要研究课题。新闻资讯类型不断丰富,数据形态逐步多样化,为用户画像提供了广阔的发展空间,在这种情况下基于用户画像的个性化新闻推荐应运而生。个性化推荐是在大数据分析和机器学习技术的基础上,通过研究用户的兴趣行为偏好,进行分布式计算,从而给用户提供高质量和符合兴趣爱好的个性化新闻资讯,解决信息过载的问题。用户画像的提取和完善过程,是个性化新闻资讯推荐的关键步骤,随着用户画像数量的指数爆炸式增长,利用大数据和机器学习技术,有效的存储、计算和更新用户画像,逐渐成为学术届和工业界的研究热点[1]。本文从新闻推荐算法工程师的角度出发,基于A公司生产环境中稳定的基础用户画像,设计相似人群算法,使用Spark分布式计算框架计算用户动态行为日志,求得群体画像,完善了基础用户画像,并从用户画像特征,新闻特征和情景特征三个维度构建特征工程,为机器学习推荐算法提供基础数据服务。特征工程搭建完毕后,进行模型训练和新闻点击率预估,按照CTR点击率从高到低对召回新闻候选集进行精排序,最后为每位用户选取点击率最高的N篇新闻,进行新闻个性化推荐,实现新闻资讯精准分发。为了提供高性能、高可靠的存储性能,我们使用Hive存储特征数据,使用MongoDB非关系型数据库存储用户的基础画像和人群画像,构建出一套千人千面的个性化新闻推荐系统。
其他文献
以城市公园绿地为研究对象,阐述公园绿地过渡空间的概念。从人的行为心理和环境行为两个方面.研究居民对公园绿地的需求,并满足城市居民对城市人文精神归属感的诉求。总结目前我
随着空间传感器技术的发展,遥感技术逐渐成为一种重要的地表观测手段。深度学习方法在计算机视觉领域,自然语言处理领域中都获得了长足的发展与良好的效果。近年来,在地表覆盖分类,遥感图像变化检测,遥感图像目标检测等遥感图像处理领域中也逐渐在引入深度学习算法。不同于传统的遥感图像处理方法,如遥感指数阈值提取、支持向量机、决策树分类器等方法人为地构建特征,深度学习通过神经网络中可学习的权重来自动提取图像特征并
建筑机电安装工程施工包括电器工程、给排水工程、弱电工程、空调通风工程等系统的施工,其施工质量的好坏将决定建筑使用质量的高低,以下对这几个方面施工管理进行了简要介绍
随着国家对基础教育重视程度的加深,科学技术不断向下普及,越来越多的人意识到从基础教育阶段培养未来人才的重要性。在信息技术日新月异、信息技术与经济生活深度融合的社会背景下,在基础教育阶段开展编程教育将成为未来人才综合素养及能力培养的重要方式之一。一方面,基础教育是教育的根基,青少年作为未来社会发展的储备人才,正处于潜力无限的状态。欧美等发达国家均出台了针对中小学生培养编程教育的文件,甚至将“编程教育
清末民初之际,西方的卫生教育思想传入中国,在进步知识分子的倡导和南京国民政府的支持下,学校卫生教育政策的制定成为历史发展的必然。广大民众和医学界等相关组织提出的合