【摘 要】
:
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的
【机 构】
:
西安建筑科技大学信息与控制工程学院,中国农业科学院植物保护研究所
论文部分内容阅读
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。
其他文献
<正> 幼儿初次站立、步行时,两脚分开并稍稍外旋以保持稳定。两侧方向比较安全,但前后方向则很不稳定,极易向前或向后跌倒。从一侧脚跟着地到该脚再次着地,叫一个步态周期。
本文通过问卷调查发现,当前江苏省农村剩余劳动力转移存在三个方面的突出矛盾。究其原因,户籍制度、劳动力市场分割、收入差距等是阻碍江苏省农村剩余劳动力转移的主要因素。
以2-丙烯酰胺基-2-甲基丙磺酸和丙烯酰胺为原料,以PEG6000为成孔剂,采用水溶液法合成多孔性聚(2-丙烯酰胺基-2-甲基丙磺酸/丙烯酰胺)水凝胶,研究了凝胶的溶胀性和电场作用下
针对齿轮系统中各项误差具有不同概率分布规律的特点 ,在指出现有理论和方法存在不足的基础上 ,提出了齿轮系统传动误差的蒙特卡洛模拟分析方法 ,为准确估计齿轮系统的传动精
在苜蓿生长过程中,杂草对其产量和草质影响较大。针对各个时期苜蓿杂草生长特点提出了相应的防治措施。
在河北省中北部,高温季节利用棚室越夏栽培番茄,因夏季高温,往往产生热害,造成较重落花落果。本文根据热害特性,从改进设施保护、进行矮化栽培、改善植株营养条件等措施,可有
节奏是话剧舞台表演的重要组成部分,它对话剧舞台表演的整体效果有决定性的影响。因此,作为话剧表演者应对节奏感有充分的重视。强烈又鲜明的节奏感,不仅能使话剧舞台表演的
从介绍功率谱的估计原理入手 ,分析了经典谱估计和现代谱估计两类估计方法的原理、各自特点及在Matlab中的实现方法 ,最后举了一个例子加以说明
随着中韩关系的密切发展,韩国的汉语学习者大大增加,相关教育部门和学校也越来越重视汉语学科的发展。忠南机械工业高中和国际通商高中是大田地区具有代表性的两所职业高中,