面向多类不均衡网络流量的特征选择方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:zhuyong006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对网络流量分类中的多类不均衡问题,提出一种基于相对不确定性和对称不确定性的Hybrid型特征选择方法。首先,利用相对不确定性为每个类选择候选特征集;然后,保留每个候选特征集中对称不确定性较高的特征并去除其他特征;最后,利用基于C4.5决策树的wrapper型特征选择方法确定最优特征子集。在真实网络流量数据集上的实验结果表明,与传统方法相比,该方法具有较高的整体准确率、小类召回率和g-mean值,从而可以减轻多类不均衡问题带来的不良影响。
其他文献
【正】 一、依靠科技进步,降低消耗。产品成本主要是由原材料、辅助材料、备品备件等物料消耗以及燃料、动力等能源消耗构成的。降低生产过程中各种消耗则成为降低成本的首选
再生码因能有效地减少修复带宽,更适用于分布式存储系统。利用干扰对齐技术,对于任意的参数(n,k,d),满足n≥2k且d≥2k-1。Suh和Ramchandran构造了修复一个失效节点时,可达到最优修复带宽的最小存储再生码。基于Suh-Ramchandran再生码,重新描述了参数(n=2k+1;k)下的编码结构,并说明这种码为一类可修复多个失效节点的再生码,且在修复单个或多个失效节点时均可达到最优的