基于K近邻和随机森林的情感分类研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:nogoodvip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决大量的文本数据会耗费大量人工的问题,论文提出了一种基于K近邻和随机森林的混合算法来实现文本的自动分类。通过最邻近投影得到"本地化"的数据集,即与一个文本向量最近邻的向量们组成新的数据集,有效地过滤掉一些不相关的数据。利用随机森林算法中多个弱分类器的多数投票机制得出最优的分类预测。实验结果表明,KNN-RF算法对在线评论文本的情感分类比传统的分类模型具有更高的分类精度。
其他文献
2013年中国科技期刊引证报告(核心版)将生态学期刊(7种)单独列为一个类别。本文通过中国知网检索这7种生态学期刊2008年刊发文章在6年内(2008—2013年)的零被引论文数量和下
1 实验仪器与药品    1.1 仪器  高效液相色谱仪Agilent1100系列,电子分析天平,涡旋混合器,超纯水仪。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
药剂师是提供药事服务的专业人员,以地方应用型本科高校安徽科技学院药物制剂专业为例,从专业培养目标、课程设置改革、教学方法改革、考核改革、校内实习改革、“厂中校”和
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
以 WOS 数据库中生态学领域期刊的引用关系为基础,应用社会网络分析方法,从期刊同被引和互引两个角度分析了生态学领域的学科结构和知识流动。在期刊同被引角度,描绘了生态学的
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
“忠”是孔子伦理道德学说中极其重要的组成部分,是中国传统伦理道德的一个重要范畴。在“忠”的俄译过程中,俄罗斯汉学家学者波波夫(П.С.Попов)、谢缅年科(И.И.Сем
基于新课标的要求,如何提高学生的综合语言运用能力,促进学生高效写作,俨然成为高中英语教师持久关注和广泛研究的话题。在此背景下,"以读促写"作为一种以"读写结合"为指导思
针对计算机对图像或者视频中目标的识别和检测,提出了基于区域建议网络和卷积神经网络的目标检测识别算法。这种算法由生成建议框的卷积神经网络、用于目标检测的Fast R-CNN网络和使边界框回归更精确的LocNet网络构成。利用该算法对VOC2007数据集进行训练和测试,并与其他的卷积神经网络进行比较,实验数据显示,以Fast R-CNN网络为基础,结合RPN网络和LocNet网络可以极大提高目标检测识