基于进化多目标优化的ROC凸包最大化算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:markhero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分类是机器学习领域最为基础的研究方向之一。作为一种基础的数据处理方法,二分类已经广泛应用于实际生活中的数据的智能化处理。传统的二分类方法通常假设数据类别分布均衡且每个类别的错分代价相等,但在很多的实际问题中少数类具有更高的错分代价。当利用传统的分类算法处理不平衡数据时,由于多数类和少数类在数量上的不平衡,以总体分类精度最大为优化目标会使得分类模型偏向于多数类而忽略少数类,造成少数类的分类精度较低。在此基础上,现实数据集中还会出现相当一部分的噪音数据样本,其中标签噪声最为常见,标签噪声样本会严重影响到分类器的训练。进化算法作为一种元启发式算法,且具有良好的并行性和较强的全局搜索能力,是非常适合用于训练分类模型。基于此,本文从进化多目标优化算法的角度提出了基于动态参考点的最大化ROC(Receiver Operating Characteristics)凸包算法和基于多目标优化的鲁棒分类器的设计与实现,现将本文的主要工作和成果总结如下:(1)ROCCH(Receiver Operating Characteristics Convex Hull)是常用的分类器性能分析技术,对于解决数据分布不平衡的任务尤其有效,ROCCH性能的最大化是一个双目标优化问题,已经被一些多目标优化算法(MOEAs)所解决。然而,现有的MOEAs在获得ROCCH的过程中会遇到一些困难,因为ROCCH总是凸的,而用MOEAs的Pareto支配关系得到的前沿面有些是凹陷的。在本文中,我们提出了基于动态参考点的进化多目标算法用于最大化ROCCH,根据解到参考点的距离排序而不是Pareto的支配关系排序,因此会获得一个真正的ROCCH而不是Pareto前沿面。此外为了算法获得更好的收敛率,在算法迭代过程中参考点会自适应的移动。实验结果表明,在最大化ROCCH方面该算法能够获得比当今主流的MOEAs更好的实验结果。(2)机器学习中的分类需要大量有标记数据的支持,而实际数据中往往带有未知比例的噪声标记,会直接影响分类器的最终结果。为了在含有噪声样本的数据集中获得性能较好的分类器,本文提出了噪音环境下具有鲁棒性的最大化ROC凸包算法。在算法迭代过程中,首先用聚类的方法获得部分纯净的训练子集,并在纯净的训练子集中训练一组种群,然后在原始含有噪声的训练集中再训练一组种群,通过计算得到两个种群的中心点,进而找到两个种群的中心点的方向向量,通过把噪音率和扰动个体与中心点的余弦相似度之和近似为种群扰动步长的策略,在原始含噪的训练集中训练得到的种群向纯净子集训练出的中心点进行扰动。实验结果表明,该方法可有效提升分类器的训练效果,使分类器具有抗噪性,从而使分类器具有一定的鲁棒性,此外,该方法具有一定的通用性,可嵌入大部分主流的进化算法来使ROCCH最大化。
其他文献
有“洪头蔡尾”之美誉的周家拳,是岭南地区鲜见的南北派功夫融为一体的拳术,距今已有百年历史,五邑武坛常有“蔡李佛礼让在先,周家拳仁义远传”一说,可见周家拳推崇的仁义精神闻名远播且深入人心。近年来国家政府对中国优秀传统文化的重视,各地区对非物质文化遗产的保护工作不断加强,以周家拳术为根衍生的武艺“大头佛”,2009年被列入佛山市第二批非物质文化遗产名录。2013年周家拳被列入江门市非物质文化遗产名录,
古代中医典籍中产后养生内容无一例外都包括产后养生禁忌,十分丰富,涉及范围较广,千百年来代有传承和发展,值得深究。但内容十分分散,繁杂,缺乏系统化,不利于现代研究和应用。而且现代产后养生研究大多侧重于宜的内容,相关禁忌内容的研究较少。本文通过对古代医学典籍中的产后养生禁忌内容进行挖掘、整理和研究,佐以现代相关研究资料,以便总结出具有中医和中华本土特色的产后养生禁忌思路和方法,不仅可以弘扬传统文化,一
太阳能光伏光热(PV/T)利用技术相比于传统的光伏发电技术有诸多优势,系统可获得额外的热量,光伏电池降温提高了其光电效率,大大提高太阳能的综合利用率。对于PV/T系统的综合利用率,PV/T集热器是关键部件,如何提高系统光热性能从而提高光电性能是当前研究热点。课题组研发了一种超薄导热太阳能吸热板,该板芯厚度小于5mm,通过层压技术使得其与光伏电池板无缝贴合,消除了接触热阻,减少能量损失,强化有效能的
目的:通过建立硝酸甘油型慢性偏头痛大鼠动物模型,探讨复方藜芍片改善慢性偏头痛大鼠头痛的机制。方法:将60只SD雄性大鼠随机分成6组:对照组(Control,n=10)、慢性偏头痛组(Migraine,n=10)、复方藜芍片低剂量组(FFLSP-L,420㎎/㎏,n=10)、复方藜芍片中剂量组(FFLSP-M,840㎎/㎏,n=10)、复方藜芍片高剂量组(FFLSP-H,1680㎎/㎏,n=10)和
癌症作为世界卫生组织界定的危害人类健康的三大疾病之一,时刻威胁着人们的生命。癌症的早期诊断与个性化的治疗对于降低癌症的致死率有着关键的作用。氟-19磁共振成像(19F MRI)与荧光成像(FLI)等分子影像学手段的应用,有助于癌症的早期诊断以及抗癌药物的体内示踪。19F MRI由于具有无组织深度限制,分辨率高以及无组织背景干扰等优点而得到了广泛的应用,但存在着灵敏度较低、成像时间较长等缺点。FLI
"诗话者,辨句法,备古今,纪圣德,录异事,正讹误也。"其论艺研几,考古辨误,非今之所谓学术研究者乎?然今之时人撰诗话者尠矣,岂其难于古人也哉!盖今日处上庠、拥皋比之士,无不
会议
目的近年来有研究表明,母系肥胖不仅对自身造成损伤,还可以影响其子代健康。为了研究母系肥胖对雄性子代成年生殖细胞的影响,本研究建立高脂饮食诱导母系肥胖大鼠模型,观察母系肥胖对雄性子代生殖细胞的影响,以及雄性子代成年后经高脂饮食再次诱导发生代谢疾病的易感性。方法Wistar雄性大鼠4周龄25只,高脂饲料诱导两周,取体重增加量中1/3为父系对照组(F0 CN,9只),基础饲料喂养10周。Wistar雌性
LiNi1/3Co1/3Mn1/3O2兼容了LiNi O2/Li Co O2/Li Mn O2三种材料的优点且弥补了上述材料作为正极材料的不足,是备受欢迎的锂电池正极材料。目前合成三元材料的方法主要有高温
盐胁迫通过离子毒害和渗透胁迫严重影响植物的生长发育和作物产量,开展植物耐盐的分子机制的研究对开展植物的品种改良具有重要意义。在拟南芥中,ATP依赖性SWR1染色质重塑复合体,由三个主要的蛋白质组成:PIE1、SEF和ARP6。SWR1复合体可以用组蛋白H_2A.Z代替H_2A,产生核小体变种,从而激活基因的表达。已有的研究表明,PIE1、SEF和ARP6通过促进开花抑制因子FLC、MAF4和MAF
本文通过文献研究、历史研究、概念分析和案例分析等方法论述了公共政策例外条款在跨境破产机制中的作用、适用原则、适用特点以及对我国构建相关制度的启示。文章分为四个部分:第一部分介绍了跨境破产中公共政策例外条款的作用以及表现形式。跨境破产中的公共政策例外条款并非单独发展起来的制度,其移植借鉴了国际私法下公共政策例外条款的适用与发展。因此,本部分首先论述国际私法中的公共政策例外条款及其作用。作为国际私法中