基于Boosting的不平衡数据分类算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:chenhua99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
究基于boosting的不平衡数据分类算法,归纳分析现有算法,在此基础上提出权重采样boosting算法。对样本进行权重采样,改变原有数据分布,从而得到适用于不平衡数据的分类器。算法本质是利用采样函数调整原始boosting损失函数形式,进一步强调正样本的分类损失,使得分类器侧重对正样本的有效判别,提高正样本的整体识别率。算法实现简单,实用性强,在UCI数据集上的实验结果表明,对于不平衡数据分类问题,权重采样boosting优于原始boosting及前人算法。
其他文献
分析了情感分析的3个主要步骤,包括文本情感获取与表达、文本情感分类与计算以及文本情感分析的应用。情感分析得到的结论主要是对相关观点的摘要、对相关事件态度的预测或者
以自主开发的内嵌式安全空间数据库管理系统SECVISTA为平台,研究带有空间特性的角色访问控制SR—BAC(Spatial Role-Based Access Control)模型的特性。定义在空间环境下的空间对
近年来随着因特网的飞速发展,计算机系统也面临着越来越多的安全威胁。国内外不少研究人员为此提出了许多种基于软计算的方法用于检测网络攻击。给出了一种基于扩张矩阵理论的
针对无线传感器网络节点因能量消耗、硬件故障、通信因素等导致的链路失效问题,提出一种基于复杂网络小世界模型Kleinberg的无线传感器网络簇间拓扑优化方法,该方法依据簇头节
为了解决传统粒子群算法易陷入局部最优解的问题,在借鉴生物学中“进化稳定策略”的基础上,对传统粒子群算法进行了改进,提出了基于稳定策略的粒子群算法。该算法的核心在于,通过
针对传统的分词方法切分军事类文本存在未登录词多和部分词条特征信息不完整的问题,提出把整个分词过程分解为若干子过程,以词串为分词单位对军事类文本进行分词。首先基于词典
进化多目标优化中由于进化算子固有的随机误差以及进化过程中选择压力和选择噪音的影响使得进化群体容易丧失多样性,而保持进化群体的多样性不仅有利于进化群体搜索,而且也是多
在NS2-MyEvalvid模型基础上分析了量化因子对传输图像质量性能的影响,并在NS2平台上通过仿真实现了基于Evalvid机制的视频流在无线局域网环境下的传输,总结归纳了编码相关参数