【摘 要】
:
在网络社交平台海量的信息文本中含有许多垃圾文本,这些文本的广泛散布影响了人们正常社交。为此,提出一种垃圾文本过滤模型。通过BERT模型提取文本的句编码,采用B-Feature方
【机 构】
:
河南大学软件学院,河南九域腾龙信息工程有限公司
【基金项目】
:
国家自然科学基金资助项目(61602525);河南省科技发展计划项目大数据环境下基于语义情感分析的个性化推荐算法研究(182102210229)
论文部分内容阅读
在网络社交平台海量的信息文本中含有许多垃圾文本,这些文本的广泛散布影响了人们正常社交。为此,提出一种垃圾文本过滤模型。通过BERT模型提取文本的句编码,采用B-Feature方法对句编码进行特征构造,并根据文本与所得特征之间的联系进一步将该特征构造为特征矩阵,运用BP神经网络分类器对特征矩阵进行处理,检测出垃圾文本并进行过滤。实验结果表明,该模型在长、中、短文本数据集上的准确率较TFIDF-BP模型分别提高7.8%、3.8%和11.7%,在中、短文本数据集上的准确率较朴素贝叶斯模型分别提高2.1%和13.
其他文献
目的探究阶段性康复护理对心脏瓣膜置换术患者术后康复及生存质量的影响。方法选取就诊的60例心脏瓣膜置换术患者,按随机数字表法分为对照组和研究组各30例。对照组术后行常
目的探讨集束化护理对小儿ICU重症肺炎患儿血气指标的影响。方法选择收治的70例重症肺炎患儿作为研究对象,采用随机数字表法分为对照组和观察组各35例。对照组行常规护理干预
目的制订芎附根痛消丸的质量控制方法。方法采用显微鉴别及薄层鉴别方法对处方成分进行定性分析。结果质控方法切实可行,重现性好,分辨性高。结论处方设计合理,质控方法可靠,能够