一种基于数据偏斜的改进KNN文本分类

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:poiuytrewq10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN是一种简单、有效、非参数的分类算法.针对样本分布偏斜的分类环境,首先提出了一种改进的特征选择方法进行特征降维,在此基础上进一步提出了一种基于分布的改进KNN方法用于文本分类,降低了分布偏斜问题对决策函数的影响.试验表明,所提出的改进KNN文本分类方法具有较好的分类性能.
其他文献
目的:检测长链非编码 RNACASC9(cancersusceptibilitycandidate9)在胃癌组织和细胞中的表达,探 讨 CASC9与胃癌患者临床病理特征及预后的关系。方法:利用 RT-PCR检测胃癌组织
有偏技术进步对传统全要素生产率方法不能较好说明的生产函数斜率变动提供了一重较好的解释,利用有偏技术进步指数能够在一定程度上说明等产量曲线斜率的变化如何作用于产出
异构网络中的垂直切换复杂于同构网络的水平切换,是一个多目标决策问题,涉及不同的网络参数,需要根据这些参数进行综合决策.文中提出了一种切换机制,终端自适应的调整网络接
复杂产品系统具有"双定制"的生产类型、"双寡头垄断"的市场特性、创新用户驱动、多利益主体参与研制等特性,这使得研制过程中面临着不同于大批量生产产品的多种风险,也加大了复杂
自密实堆石混凝土由于块石粒径较大,而无法预留试块来测定其抗压强度。回弹法作为测试混凝土抗压强度的无损检验方法,既方便又可靠。用回弹法对两个自密实堆石混凝土试件进行了