关于融合GRASP算法的选择性集成学习方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:a273582760
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于评估的准确性严重影响到金融机构的损失大小,信用评估问题得到了金融机构越来越多的关注。目前学者们已经提出很多方法用于解决信用评估问题。这些方法概括起来主要分为两大类:基于统计学的方法和基于非统计学的方法,前者主要包括线性判别分析、logit分析和probit分析等,后者主要包括支持向量机(support vector machine,SVM)、人工神经网络(artificial neural network,ANN)和决策树(decision tree,DT)等。尽管研究表明基于非统计学的方法取得了比较好的分类性能,但是单一模型用于解决信用评估问题存在着一定的局限性,后来学者们又提出了用集成学习(ensemble learning)解决该问题。然而,集成学习需要多个基分类器,这样增加了时间和空间复杂性,同时泛化能力差的基分类器也影响着集成系统最终的分类效果。然而在原始的集成系统中选择一个子集用于构建集成系统可以很好的解决这个问题,这种方法被命名为选择性集成(ensemble selection),或者也可以称之为集成剪枝(ensemble pruning)。本文提出了ELMsGraspEnS算法用于解决信用评估问题。该算法用ELM作为生成集成系统的基学习机,GraspEnS作为集成剪枝算法在原始的集成系统中选择一部分子集,因此ELMsGraspEnS继承了ELM和GraspEnS的优点。ELM算法的学习速度非常快,具有优越的泛化性能,并且可以有效的解决局部最优和过拟合问题。GraspEn S算法是GRASP算法在集成剪枝方面的应用,是一种组合优化的启发式算法,不仅具有了贪婪集成剪枝算法的优点,并且可以避免贪婪集成剪枝算法所具有的局部最优问题,另外,该算法还可以实现多点开始搜索。实验部分也表明了新提出的ELMsGraspEn S算法具有很好的分类效果。然而GRASP算法是一个无记忆算法,即在GRASP算法的迭代过程中无法利用前面迭代的信息,Path-Relinking算法是一个加强算法,融合GRASP和Path-Relinking可以避免GRASP算法中所存在的问题。鉴于此,本文提出了另一种PRelinkGrasp EnS算法用于解决信用风险评估问题,该算法也是用ELM算法作为基学习机,所不同的是在生成原始的集成系统时,用了Bagging技术,这样增加了基分类器的多样性,该算法用融合了GRASP和Path-Relinking用于选择性集成,这样不仅具有GRASP算法的优点,也结合了Path-Relinking的优势,使得PRelinkGraspEnS算法是一个有记忆的算法,实验结果表明新提出的PRelinkGraspEn S算法不仅具有优越的泛化性能,还可以加快收敛速度。
其他文献
随着万维网的发展,越来越多的信息被数字化,信息检索成为最广泛使用的计算机应用技术之一。每一秒,都有成千上万的人在搜索万维网上的信息,期望找到满意的结果。评价是信息检索的
随着社交媒体的迅猛发展,微博成为备受用户青睐的网络交流平台,微博用户性别识别逐渐成为学术界研究的热点。心理学和语言学领域的大量研究表明男性和女性在情绪表达上存在差
随着电子商务技术的不断发展,个性化推荐逐渐成为网络营销的一种策略和手段。然而,传统的个性化推荐系统只是基于孤立的Web站点上仅存的数据库进行数据挖掘进而进行个性化推荐,
设计一种节能高效的无线传感网络路由协议始终是无线传感网络研究领域的一个重要课题。无线传感网络路由协议-LEACH协议是一种经典的分簇路由协议,LEACH协议相比其他平面路由
随着移动设备的普及,越来越多的移动应用被开发。这些移动软件运行在内存有限的设备上,尽管Android系统中存在垃圾回收机制,但Android应用程序仍可能存在内存泄漏问题。内存
随着中国进入老龄化社会,老年人的日常医疗护理和援助就显得尤为需要。同时慢性病、孕妇、婴儿等也都需要长期的家庭监护。本研究项目所构建的基于无线传感器网络的家庭健康照
随着我国公路建设的快速发展,便捷的道路交通为大吨位车辆的通行提供了便利条件,但是一些车主受利益驱动超限超载运输,危及人身安全,破坏公路基础设施,扰乱了道路运输市场秩序,造成
人脸是人类最重要的生物特征之一,反映了很多重要的生物信息,如身份、表情、性别、种族、年龄等等。随着计算机技术的飞速发展,基于人脸图像的计算机视觉和模式识别问题也成
随着计算机技术和互联网技术的发展,智能家居系统也逐渐进入到我们的生活中。然而传统的智能家居系统存在着投入成本高、可移植性差、对终端要求性能高等诸多的弊端。为了实
数字水印是对数字媒体文件版权保护的重要手段。本文针对CAD系统中通用的B-Rep格式模型,研究了CAD模型的数字水印版权保护技术。与基于三角网格模型数字水印的研究不同,CAD模型