海量数据音乐用户行为的模型研究

被引量 : 7次 | 上传用户:ahhaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的进步,人们通过互联网进行信息交互变得越来越普遍,在交互过程中产生了海量的数据,其中蕴含了非常多有价值的用户信息。这些快速增长的海量数据,会有大型的数据库收集和存放,因此采用合理的运算技术去处理和挖掘其有用信息具有非常重要的价值。基于分布式原理的Hadoop技术能够提供高吞吐量的数据访问及运算。本论文运用Hadoop技术处理音乐用户行为的海量数据,根据音乐用户的特点以及音乐企业关注其网站用户的重要指标,选取了音乐用户的全站页面总访问次数、榜单页面访问次数、活动页面访问次数、播放歌曲数、下载歌曲数等六个特征作为用户的行为属性,对用户行为进行分析。选取Web服务器端记录用户在网站上的访问日志和采用JavaScript技术标记的行为日志作为分析的数据源,通过Hadoop技术,编写MapReduce并行计算程序,将用户的海量数据经过数据预处理后进行运算,建立了海量数据音乐用户行为的特征模型。本论文使用了基于划分的K-平均和K-中心聚类算法分析音乐用户行为的特征模型,通过综合考虑目标函数SSE值和聚类效果等因素,将用户聚合成6类。通过对比不同类型的用户行为,提出了更有针对性地引导不同类型用户的方法,以提高用户访问量和歌曲播放量等指标,增加用户粘性,培养更多的忠实用户;本论文的研究有助于音乐企业及时地掌握和研究用户的总体变化,找出特点和规律,为不同类型的音乐用户提供更有针对性地个性化服务,最终增大音乐企业的利润和市场份额。
其他文献
油茶为湖南省1种重要的经济作物,其病虫害种类多,发生普遍,因防治不及时或不当,每年经济损失严重。基于初步调查和参阅资料,对近年来影响湖南省油茶生产较大的病虫害的种类和
当今,全球信息化成了人类社会发展的必然趋势,信息和知识成了替代资本和劳动的最重要战略资源。随着科技的进步和发展,欧美日等西方发达国家逐步实现了从工业化社会向信息化
介绍了山西汾河上游省级自然保护区现状,在实地考察的基础上结合有关专家意见和相关文献资料,对山西汾河上游省级自然保护区范围及功能区调整的必要性进行了分析。
知识经济时代,电信基础设施在信息传播与扩散方面发挥重要作用,电信业与经济增长之间的相互关系,受到众多学者的关注。本文选取“国内生产总值”来度量区域经济水平,记为gdp,
本文基于金融功能观视角分析了中国互联网金融的金融功能。中国互联网金融实现的金融功能有:便捷地履行金融的基础功能;低成本、高效率地完成资源配置的核心功能;很好地完成
LTE是继第三代移动通信技术之后,作为长期演进过程中衍生出来的新一代无线通信技术。TD-LTE是我国提出3G通信TD-SCDMA之后发展而来的。LTE分为时分双工和频分双工,其中时分双
为进一步了解山西省旱地小麦肥料施用现状,2014年在闻喜县进行了旱地小麦肥料管理调查。结果表明,调研区54.44%的农户冬小麦产量高于平均水平,仅5.56%的农户冬小麦产量偏低。
随着移动互联网的发展使得人们真正能够随时随地从网络获取、发布信息;社交网络的普及使得社交网络用户之间的联系更加紧密,并能够相互影响消费行为;网络营销以及网络公关的不
高中物理第二册(必修)课本第88页中有这样一段文字:“只要穿过闭合电路的磁通量发生变化,闭合电路中就会产生感应电流。这就是产生感应电流的条件”。是充分条件还是必要条件
<正>中国兵器内蒙古一机集团开展"党员创新工程"活动以来,紧紧围绕"技术创新、结构调整、精益管理"三条工作主线,牢固树立服务经营意识,融入中心工作,发挥党支部的组织保证和