【摘 要】
:
近年来,随着互联网技术的飞速发展,IPTV受到了越来越多的家庭用户的青睐,使得IPTV的业务迅速扩张,用户的规模也持续增长。在如此迅速的发展速度之下,IPTV的业务目前不能只着重于信息传输速度的提升,应该更加注重用户在享受IPTV业务时的使用体验。为了提高用户的使用体验,并且为服务商提供的视频推荐、广告推送等服务提出决策性建议,能够准确地分析用户收视行为就显得尤为重要。然而,收视数据由于规模庞大,
论文部分内容阅读
近年来,随着互联网技术的飞速发展,IPTV受到了越来越多的家庭用户的青睐,使得IPTV的业务迅速扩张,用户的规模也持续增长。在如此迅速的发展速度之下,IPTV的业务目前不能只着重于信息传输速度的提升,应该更加注重用户在享受IPTV业务时的使用体验。为了提高用户的使用体验,并且为服务商提供的视频推荐、广告推送等服务提出决策性建议,能够准确地分析用户收视行为就显得尤为重要。然而,收视数据由于规模庞大,从产生到采集的过程中难以避免地会出现异常数据。因此,对收视数据的异常检测具有十分重要的意义。基于以上问题,本文提出了一种基于改进Canopy-FCM和孤立森林算法的用户异常收视行为检测方法。本文的主要研究内容体现在以下几个方面:1.提出一种改进的Canopy-FCM聚类算法。将Canopy算法和FCM算法相融合,首先使用Canopy算法对数据集进行粗略的聚类,将得到聚类数和聚类中心作为FCM算法的输入,从而进行更加高效更加精确的聚类。基于模糊决策理论,确定FCM算法模糊加权指数m的选取。基于最大最小准则和最大密度法则,针对Canopy算法中新的Canopy选取和设置过程进行改进。2.提出一种改进的孤立森林算法。在孤立森林的训练阶段,提出一种切割点选择算法,能够使得数据点在分离树上的位置更加精确。为了综合考虑样本数据的所有的特征的异常程度,本文提出基于组合权重的综合异常分数,并采用熵权法来确定组合函数中的各项权重的大小。在异常分析的阶段,提出确定异常分数阈值的算法,能够更加直观地区分异常数据样本和正常数据样本。为了验证本文所提出的改进的聚类算法和异常检测算法的优越性,本文使用用户的收视数据和相关的公有数据集,与其他传统的聚类算法和异常检测算法进行对比实验,并采用相关的评价指标对实验结果进行评估,从而验证了本文所提出的改进算法的准确性与有效性。
其他文献
针对电力系统拓扑频繁变化导致暂态稳定评估(TSA)困难的问题,提出一种新颖的基于深度学习的TSA方案.基于深度森林(DF)构建暂态稳定评估模型,创新性地提出考虑主动学习技术和分级策略的DF更新方案.该方案从样本生成和模型训练两方面最大限度节省更新时间,并在电力系统拓扑变化后快速更新DF模型,有较强实用性.最后,在新英格兰39节点系统中对所提TSA方案进行验证,结果表明该方案对拓扑频繁变化的电力系统有更强的适应性与鲁棒性.
针对谐振接地系统发生接地故障,存在暂态信号特征辨识度低,且单一特征作为选线判据易受故障条件影响等问题,提出一种基于改进EEMD与GA-BP神经网络的故障选线方法.首先使用边界局部特征尺度延拓法加集合经验模态分解和多尺度排列熵算法的混合算法(MEEMD)分解暂态电流信号,各项分解指标说明MEEMD能准确区分高频特征分量和基频分量并有效改进端点效应和抑制模态混淆.然后提取重构的高频分量能量、方向以及裕度因子等特征并将其用来训练、测试GA-BP神经网络.结果表明所提出的选线方法有较高的准确率且不受线路类型、接地
随着高速线路和交通工具的发展,高速场景下的通信已经成为人们生活中的重要组成部分。新一代无线通信系统—5G(the 5th Generation,5G)可以支持高达500km/h的UE(User Equipment,用户设备)移动速度。PRACH(Physical Random Access Channel,物理随机接入信道)承载了 PRACH preamble(前导)信号,在初始随机接入、无线链路
大规模多输入多输出(Massive Multiple-Input Multiple-Output,Massive MIMO)以及毫米波(Millimeter Wave,mmWave)通信技术的引进实现了第五代移动通信(5th-Generation,5G)时代大量用户数据的高速传输,显著地提升了通信系统的性能。随着5G技术的快速发展,各厂家在生产时需要对智能终端进行更加全面的性能测试。空口(Over
针对输电线路无人机巡检图像鸟巢检测现有方法实时性差及小目标检测能力较弱的问题,提出一种基于深度可分离卷积的轻量级YOLOv3输电线路鸟巢检测方法.首先,使用Mosaic数据增强方法增强数据集并变相提升训练集中小目标的数量;然后,在主干特征提取网络使用深度可分离卷积代替部分标准卷积,提高检测网络的速度,并降低网络参数量从而降低权重文件内存,再使用PANet代替FPN,进一步提升特征融合的能力,增强对小目标的检测能力;最后,使用标签平滑进行训练,解决由于极少量标签错误导致的网络过度自信问题和网络过拟合问题.将
提出了一种基于大数据的专变客户用能健康状态综合评价模型.首先从用能安全、经济效益和可靠性3个方面建立专变客户用能健康状态评价指标体系;进而利用改进层次分析法和熵权法对评价指标进行组合赋权;然后利用灰色关联度和马氏距离对理想解法进行改进,借助改进理想解法实现评价对象的综合排序,再结合秩和比法将评价对象分档,实现目标客户的筛选.基于某省电网专变客户的实际数据,验证了所提评价模型的可行性与有效性,并为目标客户制定了针对性用能改进策略.
准确地定位配电网的故障区段对于用户供电可靠性有十分重大的意义.目前所提出的配电网故障定位算法有一定的局限性,当信号发生畸变时,很容易出现误判,导致无法快速准确定位到故障区段.针对现有算法的局限性,考虑增加信息多源性,在遗传算法的基础上引入低压侧用户信息,构建了一个高鲁棒性的故障定位模型.通过算例仿真分析,最终证明了该算法相比于不考虑低压侧用户停电信息的算法具有更高的准确性,更加适用于实际工程.
飞行器通风冷却系统的进排气口加设格栅有助于提高整个系统的气动特性和电磁屏蔽特性.以X-47B飞行器为研究对象,设计了内埋于机身的通风冷却系统四边形开口进气道和排气道及其格栅,基于CFD方法深入分析了进/排气口格栅的4个设计参数:导流角、格栅厚度、孔径形状和孔径大小,对管道系统流阻特性的影响.结果表明,进排气道的格栅导流角越小,越接近常规进排气道,表现出更好的流阻特性;而对于进气道,格栅厚度越大,整流效果越佳,而排气道的出口需要适宜厚度的格栅兼顾整流和排气阻力;圆形孔格栅在进排气道口都表现出了较好的作用效果
针对旋翼干扰下的共轴刚性旋翼振动载荷问题开展计算分析.结合中等变形梁理论的结构动力学模型和含非定常自由尾迹的双旋翼气动模型,建立共轴刚性旋翼振动载荷计算模型.以XH-59A旋翼为研究对象,在模型验证的基础上详细分析旋翼俯仰角α、间距D以及交叉角Ψ对共轴刚性旋翼振动载荷特性影响.研究表明:增加旋翼俯仰角α会降低桨毂垂向力Fz和俯仰力矩My的3Ω谐波幅值,但会大幅增加滚转力矩Mx的3Ω谐波幅值,在高速前飞时利用俯仰角参数能调节桨毂谐波幅值水平;旋翼间距D越小,桨毂谐波幅值越高;交叉角Ψ对桨毂滚转力矩Mx和俯仰
针对高超声速飞行器仪器舱设备安装板结构轻量化和提高静/动力学性能的设计需求,融合轻质点阵结构与传统加筋结构的优点,提出一种点阵-加筋板式结构方案并建立了拓扑优化设计方法.利用均匀化等效方法计算点阵结构的宏观等效力学性能,将其作为一种虚拟材料,建立实体材料-虚拟材料插值模型.以结构整体质量为约束,整体柔顺度最小为目标建立拓扑优化问题,实现点阵-加筋板式结构布局优化设计.以飞行器设备安装板为例,分别完成了传统加筋结构和点阵-加筋板式结构优化设计.力学性能分析表明,在相同质量条件下,点阵-加筋板式结构方案具有更