基于GaussianNB模型的藏文文本分类研究与实现

来源 :青海师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:jywaco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前众多文本分类方法已经得到了广泛的应用,然而针对不同的语言结构,各分类方法的泛化能力也有差异,因此本文利用机器学习算法中的GaussianNB模型对藏文新闻类文本语料进行分类,检验该分类模型在藏文语言结构中具有良好的分类性能.分类过程中首先以一码元为文本特征,采用特征频度统计方法,形成特征值向量,然后对特征向量进行降维处理,最后通过分类实验结果,验证了该模型对藏文文本具有良好的分类效果.
其他文献
在中国新文学建设过程中,五四那一代人往往纠结于文章写作和文学创作之间,而真正使得"文章观念依然在新文学革命中发挥着重要作用"的首推周作人。他辩证地看待文章写作与文学
1926年,随着鲁迅的南下,《阿Q正传》在南方革命地区迎来了新一轮传播,甚至被改编成剧本上演。在南方革命青年的眼中,阿Q的"精神胜利法"是环境压迫的结果,走向革命是底层民众