基于改进Canopy-FCM和孤立森林算法的用户异常收视行为检测方法

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zhangnnnnnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的飞速发展,IPTV受到了越来越多的家庭用户的青睐,使得IPTV的业务迅速扩张,用户的规模也持续增长。在如此迅速的发展速度之下,IPTV的业务目前不能只着重于信息传输速度的提升,应该更加注重用户在享受IPTV业务时的使用体验。为了提高用户的使用体验,并且为服务商提供的视频推荐、广告推送等服务提出决策性建议,能够准确地分析用户收视行为就显得尤为重要。然而,收视数据由于规模庞大,从产生到采集的过程中难以避免地会出现异常数据。因此,对收视数据的异常检测具有十分重要的意义。基于以上问题,本文提出了一种基于改进Canopy-FCM和孤立森林算法的用户异常收视行为检测方法。本文的主要研究内容体现在以下几个方面:1.提出一种改进的Canopy-FCM聚类算法。将Canopy算法和FCM算法相融合,首先使用Canopy算法对数据集进行粗略的聚类,将得到聚类数和聚类中心作为FCM算法的输入,从而进行更加高效更加精确的聚类。基于模糊决策理论,确定FCM算法模糊加权指数m的选取。基于最大最小准则和最大密度法则,针对Canopy算法中新的Canopy选取和设置过程进行改进。2.提出一种改进的孤立森林算法。在孤立森林的训练阶段,提出一种切割点选择算法,能够使得数据点在分离树上的位置更加精确。为了综合考虑样本数据的所有的特征的异常程度,本文提出基于组合权重的综合异常分数,并采用熵权法来确定组合函数中的各项权重的大小。在异常分析的阶段,提出确定异常分数阈值的算法,能够更加直观地区分异常数据样本和正常数据样本。为了验证本文所提出的改进的聚类算法和异常检测算法的优越性,本文使用用户的收视数据和相关的公有数据集,与其他传统的聚类算法和异常检测算法进行对比实验,并采用相关的评价指标对实验结果进行评估,从而验证了本文所提出的改进算法的准确性与有效性。
其他文献
随着高速线路和交通工具的发展,高速场景下的通信已经成为人们生活中的重要组成部分。新一代无线通信系统—5G(the 5th Generation,5G)可以支持高达500km/h的UE(User Equipment,用户设备)移动速度。PRACH(Physical Random Access Channel,物理随机接入信道)承载了 PRACH preamble(前导)信号,在初始随机接入、无线链路
大规模多输入多输出(Massive Multiple-Input Multiple-Output,Massive MIMO)以及毫米波(Millimeter Wave,mmWave)通信技术的引进实现了第五代移动通信(5th-Generation,5G)时代大量用户数据的高速传输,显著地提升了通信系统的性能。随着5G技术的快速发展,各厂家在生产时需要对智能终端进行更加全面的性能测试。空口(Over
准确地定位配电网的故障区段对于用户供电可靠性有十分重大的意义.目前所提出的配电网故障定位算法有一定的局限性,当信号发生畸变时,很容易出现误判,导致无法快速准确定位到故障区段.针对现有算法的局限性,考虑增加信息多源性,在遗传算法的基础上引入低压侧用户信息,构建了一个高鲁棒性的故障定位模型.通过算例仿真分析,最终证明了该算法相比于不考虑低压侧用户停电信息的算法具有更高的准确性,更加适用于实际工程.