【摘 要】
:
在当今社会中,随着各种各样信用经济形式的诞生,银行、信贷机构等都收集了大量的个人信用数据,为了利用这些历史数据来构建信用评估模型,越来越多的信用评估方法被提出来。目
论文部分内容阅读
在当今社会中,随着各种各样信用经济形式的诞生,银行、信贷机构等都收集了大量的个人信用数据,为了利用这些历史数据来构建信用评估模型,越来越多的信用评估方法被提出来。目前的信用评估方法有;逻辑回归、支持向量机、决策树等,但是由于在信用评估方法中,涉及到的客户属性众多,许多研究者的做法都是将收集到的信用数据全部作为模型的训练数据,这样的做法并不能够保证训练出的模型具有良好的泛化能力。因此,本文研究了一种能够自动进行特征降维的降噪自编码神经网络,以其作为信用评估模型的基础来进行主要特征的学习,然后将学习到的特征数据作为模型的输入,以提高模型对信用好坏客户的分类能力。本文主要的研究工作和创新点包括以下几个内容:首先,给出了信用评估的一些基本知识,对信用评估的国内外研究现状进行了简要的分析,为后续的新的信用评估模型提出提供了基础。然后,描述了采用的基于降噪自编码神经网络与单一信用评估模型相结合的信用评估模型,这里主要包括了降噪自编码神经网络的原理以及其训练过程、信用评估方法的原理。并且针对信用评估问题中数据量大的特点,采用一种基于K-均值聚类的支持向量机信用评估方法,该方法首先通过对训练数据进行聚类,然后对每个类通过降噪自编码网络进行特征学习,使用这些学习的特征分别进行支持向量机模型的训练。对未标记的数据,首先计算其距离各个聚类中心的距离,选择距离最近的类所训练的模型对其进行分类。最后,进行了实验的设计与验证。由于个人信用数据中包含大量隐私信息难获取,因此只使用了德国信用数据和Kaggle竞赛的两个公开数据集来进行实验。本文使用了正确率,第一、二类分类误分率以及AUC值作为评价标准,与其它方法的实验结果进行了对比分析,验证了采用的模型的正确性和可行性。
其他文献
版权扩张是一把双刃剑,虽然为版权人带来了更多利益,但与此同时也展现出它的局限性。从严格意义上讲版权并不等同与一般私权,理应受到诸多限制,然而版权并未按照理性道路扩张,反而自身发生异化走向版权制度的对立面。盲目扩张版权疆域,将使得版权制度沦为逐利的工具。洛克劳动财产理论中的先决条件是版权私权正当性必须满足的前提,缺乏丰富的公有领域,版权私权最终会失去合理性基础,因此版权扩张必须受到限制。本文主要分为
研究区位于秦岭褶皱带东段,属秦岭地层区北秦岭分区。乔端-瓦穴子区域性成矿构造带为北秦岭区域重要的断裂带之一,研究区位于其南侧,次级构造发育,为成矿物质的迁移和富集提
目前农田水土流失、缺水干旱和生态环境退化已经成为制约世界农业可持续发展的主要原因。同时由于自然灾害以及人类耕作方式的不当对农田生态环境产生的危害也正日益加剧。其
抗生素类药品因有较强的抑制和杀灭细菌的效果而被广泛用于各种病菌感染性疾病的治疗。近些年,由于医学、农业及畜牧业的不断发展,对抗生素的需求程度从逐渐增加到极度依赖,导致抗生素滥用并造成日益严峻的水环境污染问题。四环素是一种结构相当稳定、在自然条件下极难降解的广谱抗生素,传统的处理方法因受各种技术限制处理效果不尽理想。在此背景下,绿色、高效、无毒的光催化处理技术应运而生且备受关注。铋系含氧酸盐类光催化
现在各保险公司产品差异不大,重点竞争就变成保险服务的竞争了,如何在激烈的竞争中占有一席之地,就要从服务品质着手。保险公司产品具有特殊性,通过服务体验产品,而服务比较
通过对锡林郭勒盟所在地区各行业煤炭需求量预测,在“十五”后两年地区煤炭消费弹性系数在2.5,“十一五”期间及以后回落到1.0左右,据此预测内蒙古西部地区2005~2020年煤炭消
统编小学语文教科书采用的“双线组织单元结构”,即按照“内容主题”组织单元,课文大致都能体现相关的主题,形成一条贯穿全套教材的、显性的线索。另外一条线,即语文要素。这种编排结构使语文课程倡导人文性的同时更加重视工具性,以实现语文课程工具性与人文性的统一。统编小学语文教科书的使用为语文教学实践带来改变的同时也带来了一些挑战和困难,越来越多的教育者开始重视“双线组织单元结构”的教学实践研究,以期为语文教
9.11事件,不仅导致纽约市地标性建筑从此消失,数千人伤亡,同时因为很多知名企业均有办事处设置于世贸中心,客户交易资料全毁以及办公人员的伤亡让很多企业在灾后举步维艰。此
中共建国以后,在文化娱乐较为匮乏的年代,受到市民喜爱的南京城区的租书摊一度延续了以往的繁荣。由于租书摊本小利薄,故多为处于社会边缘的弱势群体从事该行当,露天经营的摊
通过文献资料、专家访谈、实地观察及逻辑归纳等方法,阐述了情报信息、体育情报信息、竞技体育情报信息的基本概念、内涵及研究状况。结合前人的研究提出了竞技体育情报信息