一种新的处理非均衡数据的非迭代核逻辑回归方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:newhing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非均衡数据的分类问题广泛存在于金融、医疗、电信等领域,而传统的分类方法如决策树、支持向量机等存在对少数类识别不够准确的问题。本文针对严重非均衡数据提出一种非迭代核逻辑回归的学习方法,不仅减轻了由于迭代所造成的运算负担,而且在模型训练中利用了基准的类别占比信息,避免了进行诸如欠抽样、过抽样等通常处理非均衡数据的方式,使得在数据规模大的非均衡数据情形下,可以方便的对核逻辑回归进行建模,构造具有稳健性的近似最小二乘逻辑回归分类器。理论研究表明,本文所提方法具有一定的优良性质。模拟研究及实证分析表明,我们提出的方法较经典的迭代方法在训练核逻辑回归时大大减少训练时间,同时在非均衡数据特别是严重非均衡数据时表现优于结合了欠抽样、过抽样的分类方法。另外对于核逻辑回归中的多个参数选取问题,本文采用正交表实验设计,大大减少了调参时间。
其他文献
<正>为便于论文分类索引,本刊增设论文分类号。按《中国图书馆分类法》(第4版)标注,一般只标注1个即可,若一篇论文涉及多个学科,在主分类号之后还可以标注1~3个相关学科的分
作为国家经济发展的重要支撑与重要组成部分,国有企业是我国财政收入的重要来源,也是推动中国特色社会主义经济社会不断发展的先锋力量。国有企业的健康有序发展,对于推动我
中国改革开放30年以来,经济得到长足的发展,但同时中国也进入了转型的关键时期。我国一直以来的定位是劳动密集型国家,低廉的劳动力成本是我国的比较优势,然而随着全球一体化
随着社会的不断进步,尤其在改革开放之后,我国企业的制度发展不断取得新成效。在企业管理中,企业的内部控制需要重视,大部分的企业内部控制并不完善,一直以来都是问题,这样会
以数字化、网络化、移动性、低进入壁垒为特征的新媒体技术裹夹着全球化的飓风,正在改写整个世界信息传播的形态、格局、结构和规则。信息传播技术的发展和便携式计算机的普
随着教育信息化发展的不断深入,媒体与技术的不断发展以及现代教学理念的深化。国内越来越多的学校引进了iPad移动设备,并试点开展iPad进课堂活动,作为信息化教育的前沿尝试,
1996年以来,我们分别采用曲安缩松和醋酸强地松龙混悬液行病灶区基底部注射的方法,治疗口腔扁平苔癣(OLP),观察两种药物的临床效果,现报告如下。1临床资料1.1病人及分组经临床及病理诊断为OLP病人
在新闻稿件中,恰当地使用直接引语不仅可以增强新闻的真实性与权威性,同时也会令读者产生身临其境的现场感,增强新闻稿件的可读性。同时,正确合理地使用直接引语,还可有效规避新闻
近年来,人们越来越关注从生理学到食品科学的不同领域中抗氧化剂的作用和重要性,检测清除自由基能力是评价样品抗氧化能力是一种良好方法。自由基氧化及其产生的中间产物严重
采用超高压法、超高压处理后再用木瓜蛋白酶水解、超高压下直接酶解等方法分别处理南美白对虾水溶性蛋白,虾肉组织和虾仁,消减其过敏原。结果表明:对提取的水溶性蛋白,采用超