【摘 要】
:
朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分
【机 构】
:
山西财经大学信息与管理学院,北方交通大学计算机与信息技术学院
论文部分内容阅读
朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分类器。然而,由于学习TAN所需的空间是数据属性个数的二次项级,限制了TAN对高维数据(如:文本数据)的分类,本文介绍了TAN模型及其一般的构造算法,提出一种新的TAN构造算法ITAN,该算法的空间复杂度是数据属性个数的线性级,最后将该算法用于文本分类,实验比较了朴素贝叶斯分类器和TAN分类器,实验结果表明:该方法
其他文献
1 临床资料患者,男,24岁,广西汉族人,驻桂某部士官,自诉曾吃生猪肉、生鱼片,于2002年4月开始,解大便时发现有"面条样"白色虫体排出,最多一次排出5条,最长有一米,可自行爬出.
我们对破裂型输卵管妊娠行电视腹腔镜下输卵管局部注药术与输卵管切开取胚术,将两种保守性手术效果进行比较报道如下.
胃肠功能障碍作为多系统器官功能衰竭(multisystem and organ failure,MSOF)的一部分,正日益受到人们的关注,及时诊治胃肠功能障碍是抢救危重新生儿的关键.本文对从1996年1月
重症急性胰腺炎(Severe acute pancretitis,SAP)起病急,发展快,较易并发多器官功能衰竭,病死率较高.近10年来对SAP发病机理及病理演变过程的进一步深入了解,特别是我国1996年
我科从2002年9月至2003年10月,应用万乃洛韦片(商品名:丽珠威)及阿昔洛韦片治疗带状疱疹,并进行疗效对比,现将结果报告如下.
关于中国法律史研究发展历程的论著并不少见,其中以王志强“中国法律史学研究取向的回顾与前瞻”、许章润“书生事业无限江山——关于近世中国五代法学家及其志业的一个学术
胃镜检查是消化内科常用的检查和治疗方法之一,咽喉部局麻下的胃镜检查,常因检查时出现剧烈的恶心、呕吐、咽喉部疼痛等,使患者不能很好的配合,甚至产生恐惧心理.通过静脉注
近十余年来,随着我国法治进程的加速推进,各种新法律文件迭出,历史遗留下来的诸种制度也因此面临着存在合理性的质疑,包括劳动教养、收容教育等在内的强制措施则更陷入了必须
"言语者,思想之代表也。故新思想之输入,即新言语输入之意味。"--王国维:《论新学语之输入》(1905)颁布于宣统二年十二月二十五日(公元1911年1月25日)的《大清新刑律》是沈家
慢性硬脑膜下血肿(CSDH)一般指头部外伤后3周以上开始出现症状,位于硬脑膜与蛛网膜之间,具有包膜的血肿[1].本病头部外伤轻微易被遗忘,起病隐袭,临床表现无明显特征,容易误诊