基于特征表现的虚假评论人预测研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:estone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]重点探讨基于特征表现的虚假评论人的预测,目的在于揭示真实网络环境中“网络水军”的特点和行为规律,构建一个简洁清晰、可解释的评论人身份预测模型,为深层次的评论挖掘研究奠定基础。[方法/过程]结合实证分析和机器学习技术,对目标网站“大众点评网”的内部评价机制进行探索,利用因子分析提炼评论人属性及行为表现特征,并在此基础上构建基于Logistic回归的预测模型。[结果/结论]对于目标网站,模型对虚假评论人的分类预测精度达到73.8%,AUC指标达到80.9%。而评论人的贡献度、活跃度以及文字素养被验证与其身份有统计意义上的显著关系,但评论人的层级、情绪以及评价偏差则对其身份预测的影响不显著。实验结论和经验分析基本保持一致,模型能够被合理解释。 [Purpose / Significance] Focusing on the prediction of false commentators based on feature manifestation, the purpose is to reveal the characteristics and behavior rules of “Network Water Army ” in the real network environment and to construct a concise, clear and interpretable model of commenter identity prediction , Which lays the foundation for further research on mining of comments. [Method / Process] This paper explores the internal evaluation mechanism of the target website “Public Comment Network ” combining with the empirical analysis and machine learning techniques, extracts the attributes and performance characteristics of the reviewers by means of factor analysis, and builds on the basis of Logistic Regression regression model. [Results / Conclusions] For the target website, the model predicts the accuracy of the classification of false commentators to 73.8% and the AUC index to 80.9%. However, the contribution, activity and literacy of commentators are verified to have a statistically significant relationship with their identities. However, the influence of commentators’ hierarchy, emotion and evaluation bias on their identity predictions is insignificant. Experimental conclusion and empirical analysis basically the same, the model can be reasonably explained.
其他文献
通过平面模具淬火试验,对不同显微组织的热冲压成形用钢进行模拟冲压,比较不同带状组织对热冲压成形用钢的拉伸性能、折弯性能的影响,同时对横纵向性能差异进行对比。结果表
针对个性化推荐系统中用户的多个不同需求,提出一种基于免疫算法的求解方法。该算法将要求解的个性化推荐列表建模成一个最大化推荐准确性和多样性的多目标优化问题,采用基于
打好碧水保卫战需要减排扩容。寒地河流治理需要因地制宜,充分发挥地域优势,继续开发利用氧化塘,构建污水处理厂+氧化塘与水利枢纽工程相结合的减排扩容系统;形成现代工程和
This paper presents a relevance vector regression(RVR) based on parametric approach to the bias field estimation in brain magnetic resonance(MR) image segmentation. Segmentation is a very important an
期刊
<正>2017年12月30日,国家外汇管理局发布《关于规范银行卡境外大额提取现金交易的通知》(以下简称《通知》),规范银行卡境外大额提取现金交易,完善跨境反洗钱监管。《通知》
游泳是一项很有价值的运动。它可以提高人体神经系统的兴奋性和灵活性,促进人体的新陈代谢,提高人体各器官系统的工作能力。游泳运动对肺脏影响较为显著。出于水的密度比空气