【摘 要】
:
针对当前文本情感分析精度不高的问题,提出将PCA-SVM算法应用于文本分析。为了减少样本训练的负担,评论文本经过预处理、分词、去停用词和提取特征词向量以后,通过PCA算法对
【基金项目】
:
江苏省大学生创新创业指导项目(No.201813842031X)
论文部分内容阅读
针对当前文本情感分析精度不高的问题,提出将PCA-SVM算法应用于文本分析。为了减少样本训练的负担,评论文本经过预处理、分词、去停用词和提取特征词向量以后,通过PCA算法对文本词向量进行降维,在降低维度的同时,可以最大限度得保留样本的原始数据特征。分别使用Naive Bayes算法、Logistic Regression算法以及SVM算法作为文本分类模型,对三种不同算法场景下的Accuracy和AUC两个指标参数做分析对比,实验结果表明PCA-SVM算法在中文文本情感分析领域具有一定的优势。
其他文献
目的研究人文关怀对肛周疾病患者术后的影响。方法将2018年1月~2019年1月我院收治的肛周疾病患者86例,分为实验组和对照组各43例。对照组术后行常规护理,实验组术后行人文关
随着当今社会科技的发展,大量的科技术语不断出现。这些科技术语来自不同的领域,如医学、地质学、电力学等。科技术语较之于其他词汇而言更具有专业性、系统性。在信息技术高
运用文献资料法、调查分析、专家咨询法等方法对目前中学体育教学改革中普遍存在的一些现象进行研究,并就迫切需要解决的教学观念转变、教学方法改革、教材改革、运用现代教育
矮砧集约栽培种植模式,是近年来烟台地区重点推广的苹果集约化种植模式。依托国家省市补助资金项目,烟台各县市区均建立了一定规模的矮砧集约高效苹果园。烟台市农科院苹果研
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
利用分子自组装技术采用两嵌段聚合物或共聚物制备出了水性丙烯酸改性环氧聚酯纳米乳液。合成出的聚合物纳米乳液的粒径随反应温度的升高而逐渐减小,当温度升高到100℃时,聚合