一种代价敏感随机森林算法

来源 :武汉大学学报(工学版) | 被引量 : 0次 | 上传用户：linhom222

【摘要】

：

数据高维且不平衡时,产生的分类器易过度拟合且倾向于牺牲少数类准确率.为降低分类器复杂度且提高少数类识别率,提出了一种代价敏感随机森林算法.以随机森林算法框架为基础,

【作者】

：

尹华胡玉平

【机构】

：

广东财经大学信息学院,

【出处】

：

武汉大学学报(工学版)

【发表日期】

：

2014年05期

【关键词】

：

cost-sensitive random forest test cost misclassification cost

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据高维且不平衡时,产生的分类器易过度拟合且倾向于牺牲少数类准确率.为降低分类器复杂度且提高少数类识别率,提出了一种代价敏感随机森林算法.以随机森林算法框架为基础,利用Bagging平衡数据,并在基分类器属性分裂度量以及评价函数中引入误分类和测试双重代价,其中测试代价由分裂属性与少数类的相关度决定,使得基决策树在建模过程中向少数类倾斜.与随机森林和仅引入误分类代价的随机森林相比,引入双重代价的随机森林的分类准确率较高,尤其在少数类识别上具有较大优势. When the data is high-dimensional and unbalanced, the generated classifiers tend to overfitting and tend to sacrifice the accuracy of minority classes.In order to reduce the classifier complexity and improve the recognition rate of minority classes, a cost-sensitive stochastic forest algorithm is proposed, Based on the forest algorithm framework, Bagging is used to balance the data, and the misclassification and testing costs are introduced into the base classifier attribute splitting metric and evaluation function. The test cost is determined by the correlation between split attributes and minority classes, Compared with random forest and random forest which only introduced misclassification cost, random forest with double cost is more accurate in classification, especially in minority recognition.

其他文献

MAD国际实践总览

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

提高水利工程中计算机的应用

新时期是信息技术新时代，计算机技术覆盖、支持了各行各业的运营和发展，水利工程建设也得益于计算机技术的支持，获得了全新的经济效益。本文分析了计算机技术在水利工程中的具体

期刊

水利工程计算机应用

峰谷电价下水厂取水泵站最优控制策略

在建立取水泵站能耗模型基础上,将泵启停次数作为附加抑制项引入目标函数以限制泵的频繁启停;并采用粒子群优化算法求解此优化问题.以一座配置定速泵的取水泵站为例,分别对基

期刊

pump station optimal control time-of-use tariff on-off frequency inhibiting

T细胞免疫球蛋白黏蛋白-1的免疫调节作用及抗肿瘤机制研究进展

肿瘤免疫抑制是肿瘤免疫逃逸的重要原因,寻找逆转免疫抑制和增强抗肿瘤免疫应答的新靶点尤为重要[1].T细胞免疫球蛋白黏蛋白(TIM)-1是TIM家族成员中重要的共刺激分子,主要表

期刊

医源性胆管损伤后的微创治疗

目的探讨医源性胆管损伤的类型、临床和影像学特征以及内镜和放射介入治疗的疗效和安全性。方法收集2013年1月1日至2016年6月30日因医源性胆管损伤行介入或内镜诊疗的48例患者临床资料，回顾性分析患者一般情况、导致胆管损伤的相关医疗操作、胆管损伤的类型及临床表现、治疗方式、疗效、并发症。结果胆管损伤发生的原因依次为胆囊切除(45.8%，22/48)、肝移植(35.4%，17/48)、经颈静脉肝内门

期刊

Cholangiopancreatographyendoscopic retrogradePortasystemic shunttransjugular

梦露大厦

期刊

电脑的远程控制

本文简单的介绍了一下电脑的远程控制的主要应用，讲述了它怎样使用，如何操作以及设置，重点分析个体以及家庭用户所面临的几个问题，并且遇到这样的问题我们应该如何去处理。

期刊

网络电脑远程控制内网外网Winvnc

风情英伦

期刊

氮铝钛表面涂层刀具技术在切削加工中的应用

采用氮铝钛(TiAlN)涂层硬质合金刀具对不锈钢、模具钢进行切削实验,并与未涂层硬质合金刀具的寿命作比较.研究了TiAlN涂层刀具与未涂层硬质合金刀具在不同的切削参数下的刀具