基于尾项加权的自适应文本分类方法研究

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:editorzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于朴素贝叶斯分类框架,通过添加尾项值对部分严重扭曲的分类结果进行调整,达到提升分类器性能的目的.方法通过增量式自适应学习分类模式,根据历史结果,判断分类器分类质量,进而确定尾项添加区间,对明显产生分类扭曲的区间结果自适应添加尾项补偿,调整分类结果.在Trec05,Trec06,Trec07,Ceas08数据集上的对比实验表明,改进算法在accuracy,Macro F1两个指标上均比朴素贝叶斯分类器和bagging朴素贝叶斯分类器显著提高,且方法简单易行.
其他文献
【正】 一、合同关系的新发展需要新的法律调整我国的合同制度的发展,经过了曲折的道路。党的十一届三中全会以来,实行经济体制改革,大力发展商品经济。作为商品交换的法律形
开放探索型试题重在开发思维,促进创新,提高数学素养,是近几年中考试题的热点.中考数学试题中关于全等三角形的探索型问题更是倍受关注.现举例分类说明.……
期刊
【正】 最近,有人提出了创立《检察学》的设想,触及了当前法学理论研究中的一个新课题。我们鉴于检察工作的实际需要,也有志于《检察学》的创立。现略陈己见,以期受到法学理
期刊
函数中考题主要涉及函数概念,一次函数及反比例函数的图象、性质.观以2006年中考试题为例,与各位读者一起感悟函数及其图象中的数学思想方法.……
期刊
安徽石油把比学赶帮超活动作为贯穿全部工作的一条主线,以调动广大员工积极性为出发点,以严格的奖惩措施为手段,将活动固化为工作,建立"比学赶帮超"工作的长效机制,公司各项工
在糖尿病人发展为高血压以前用ACE抑制剂治疗可以预防心血管并发症。
散乱点集曲线重建关键步骤是参数化.提出了一种对平面上有噪音散乱点集参数化的新算法.算法中,首先求出点集的Delaunay三角化的最小生成树,继而对最小生成树的最长路径进行参
有报道IL-4可以杀死各种类型的癌细胞,可促进细胞毒T细胞分化,促进巨噬细胞趋化及杀伤作用[1,2]。紫杉醇是一种从太平洋紫杉属短叶紫杉茎皮中提取的抗肿瘤药物,它属于细胞周期G2+M
分析了Cohen-Grossberg神经网络的指数稳定性(局部指数稳定和全局指数稳定).给出了基于矩阵测度的判定Cohen-Grossberg神经网络的指数稳定的充分条件.并且对于局部指数稳定的平