基于主题模型的IPTV用户行为模式挖掘

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:njcdst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,IPTV(交互式网络电视)在人们生活中的应用越来越广泛。不同于普通电视,IPTV上的用户可以与电视进行交互,用户的行为更加个性化。分析用户的行为数据并挖掘出用户的行为模式,可以发现用户的收视偏好,从而进行针对性的节目推荐,制定个性化节目菜单,也可以根据用户的行为模式进行针对性的广告投放。主题模型是一种分析大规模文本的统计模型,它可以将高维的文档-单词空间映射到低维的文档-主题空间和主题-词空间,从而实现文档的聚类,潜在主题的挖掘等。IPTV的用户行为数据以文本形式存在,每个家庭的行为数据可视为一篇文档,因此可以用主题模型从用户行为数据中挖掘用户的行为模式。本文首先分析了IPTV用户的行为数据特征,IPTV用户一般为一个家庭,家庭中不同成员收看节目的时间一般不同且IPTV用户的行为记录有收视、收藏和浏览记录。然后基于以上特征,本文提出了多行为时间耦合的主题模型(Multiple behavior coupled Time LDA,MT-LDA),用以挖掘用户的行为模式。最后,本文提出了该模型的在线学习算法,该算法可以在新的行为数据产生后迅速更新模型,并且捕捉用户行为模式发生的变化和主题的演化过程。本文的创新点如下:1)本文提出了基于用户多种行为的MT-LDA模型,该模型改进了cLDA模型,综合了用户的收视、收藏和浏览记录,及这些行为记录产生的时间信息来挖掘用户的行为模式。实验结果表明该模型可以得出电视节目的隐含主题,并且可以得到每个家庭不同时间主题下的收视偏好分布,相比于cLDA模型,MT-LDA模型得出的同一个主题下的节目相关性更强,MT-LDA模型的困惑度低于cLDA模型。2)本文提出了MT-LDA模型的在线学习版本online MT-LDA,将数据逐个时间窗传入模型进行训练,新数据到来之后不需要对全部数据进行重新训练,只需要训练新加入的数据即可更新模型。Online MT-LDA可以发现主题随时间的演化过程,可以更准确的发现不同主题下的节目热度变化;也可以发现用户行为模式随时间发生的变化,从而提供更精准的个性化服务。
其他文献
光波导是基于光在折射率不同的介质界面之间会发生全反射的原理,将光波限制在微米量级的光波导结构中,使其达到较高的腔内密度且仅能在光波导内传输。在光通讯和集成光子学等领域中发挥着重要作用。掺杂稀土离子的光学晶体被广泛应用于光波导的制备。离子注入技术是一种传统的平面光波导制备方法,具有一定的能量的离子注入到不同材料中导致材料的折射率改变,进而形成光波导结构。飞秒激光加工技术作为一种新型的光波导制备方法,
员工持股计划(ESOP)20世纪中期起源于美国,是企业所有者与员工共同分享企业所有权和未来收益权的一项制度,其理论基础是美国律师路易斯·凯尔索于1958年提出的扩大资本所有权思想。员工持股计划使员工可以通过购买公司股票而拥有公司的部分产权和未来收益权,借此将员工利益与企业绩效紧密联系,以实现吸引人才、稳定团队和长效激励的目标。我国员工持股计划实施起步较晚,自上世纪80年代以来,伴随着我国国企改革进
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动的对地侦查雷达系统,主要用于飞机、卫星等航天器,它能全天24时的对地面进行观测。近年来,随着SAR成像研究的不断进步,SAR图像的分辨率越来越高,因此如何快速的、准确的检测出SAR图像中的目标种类并对其定位是当前的一大研究热点,具有重要的研究价值。论文基于深度学习方法对高分辨率SAR图像目标检测进行研究,主要工作如下
近年来,随着电子技术、无线通信技术的迅速发展,无线传感器网络的相关问题研究已成为计算机网络领域研究的前沿问题。网络覆盖率与节点有效部署已经成为无线网络研究的核心问
股权再融资(Seasoned Equity Offering)指上市公司配股或增发,是企业积累资本、把握投资机会的重要手段。国内外资本市场实践表明,上市公司在股权再融资之后的业绩表现往往会出现中长期的下滑。这一现象被称为“SEO业绩下降之谜”(New Issues Puzzle)。当前的中国经济正稳步进入新常态,结构性改革深化过程也有条不紊地逐渐展开,若能明确究竟是何原因导致SEO后期的业绩下降,
近年来,对预期的管理成为宏观调控的重要手段。中央银行沟通作为影响预期的重要方式,其重要性也在相应地提升。随着我国政策透明度提升,中国人民银行也不断通过各种形式的沟通传达其货币政策信息,并对市场预期进行引导。因此,研究中央银行沟通能否合理引导市场预期并对债券市场收益率产生影响具有重要意义。本文主要研究中央银行的沟通机制能否对债券收益率产生影响,分析中央银行能否通过各种形式的沟通引导沟通对象形成合理预
传统的标识设备已经难以满足现代钢铁行业复杂多样工件的标识要求,故而基于机器人的标识设备的研发愈发重要。因现代生产标识设备要求更快速;能适应复杂的工件标识要求;且运
随着人工智能概念的逐渐普及,人工智能的发展越来越得到人们的重视,甚至,人工智能已经列入国家重点发展产业。现在的人工智能还处于弱人工智能时代,未来将有机会突破,可以更好的帮助人类解决问题,改变人们的生活方式,进入智能化的时代,会出现智能机器人、无人驾驶等技术,人工智能将会在社会的各个领域发挥更大的作用。深度学习就是利用神经网络来表达学习的过程,神经网络的学习方法很形象地模拟了人类大脑的思维方式,表现
随着全球经济一体化发展趋势的逐步深入及医疗商业市场环境急剧变化,医疗行业内的竞争越来越激烈,为了在激烈的竞争中站稳脚跟,医疗企业必须通过设备改造提高设备的生产率、
随着经济快速发展,开放源颗粒物对大气环境的污染越发严重,逸散的大气颗粒物会引起雾霾、料堆材料浪费、危害人体健康以及制约经济的发展。减少开放源颗粒物最有效的管理策略之一是在大气颗粒物的扩散过程中设置植被屏障或者人工多孔屏障来阻滞拦截颗粒物。植被屏障能作为一种多孔介质,可将不同粒径颗粒物滞留于树冠内部,且可通过枝叶摆动调整孔隙度以适应风力变化,但植被生长受水资源、土壤质地和季节的限制。人工多孔屏障,包