基于关系的垃圾评论检测方法

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:lj200610819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
购物网站评论为消费者比较商品的质量、店家的服务等提供了有价值的信息。然而垃圾评论者通过发表虚假的、不公正的评论来误导消费者。现存许多基于评论者行为特征的垃圾评论检测方法,但这些方法对于有意模仿正常评论者行为的垃圾评论者是无法检测的。垃圾评论检测工作之所以困难很大,是因为垃圾评论者可以轻松的发表与正常评论相似的评论,所以单单从评论或评论者出发的检测方法性能很低。本文首先通过层次分析法得到店家的可信度、评论的文本等特征得到评论的诚实度,然后根据评论关系图分析评论者、评论、店家的交互关系,最终使用Logistic进行分类。评论关系图由三种类型的节点构成,评论者、评论、店家,分析得出三者的交互关系:评论者所发表的诚实的评论越多,他的可靠度就越高;店家所得到的来自可靠评论者的诚实正面评论越多,它的可信度也越高;评论和其它周围诚实评论的相似度越高,该评论的诚实度也就越高。这是在垃圾评论检测领域首次提出基于交互关系的检测方法,解决了检测信息量较少的局限。实验证明,本文提出的检测方法检测出的垃圾评论类型更复杂、更精细,同时在精确率、召回率等各项指标均有所改善,而且大大缩短了计算程序的运行时间。
其他文献
本文在智能手机项目组的研发工作中,深入分析了ARM-Linux与uCLinux的内核,并在三星S3C44B0X CPU上成功移植了uCLinux。通过对现有uCLinux实时化技术的分析,提出了一种对uCLinux
三维场景的信息采集、捕获及对目标物体的绘制一直以来是计算机视觉与计算机图形学研究的热点之一,目的是为了让计算机像人一样感知场景、获得信息,能够精确、快速再现和还原场
  词法分析是自然语言处理领域中最基础的处理步骤,尤其对汉语这种没有分割符的语言来说更是如此。本文研究的汉语词法分析主要包括自动分词、词性标注和词义相似度计算三个
作为物联网的主要组成部分之一,无线传感器网络需要在资源有限的情况下采集、处理并传输周围环境中的信息。在实际应用中,这些信息的安全性是需要优先保证的,因此在数据融合
人脑作为一个高效的神经网络,一直是人工神经网络模拟的目标。但由于网络规模和突触元件的制约,人工神经网络的功能受到了极大的限制。忆阻器的出现,为人工神经网络从电路上模拟
随着广泛计算需求的出现和便携计算设备的繁衍使得无线网络越来越重要。在这些系统环境中,出现了有着特殊配置的移动Ad Hoc网络。Ad Hoc网络同样面临无法保证业务质量的问题
虹膜具有丰富的、独特的纹理特征,非常适用于身份鉴别。与其它生物特征相比,虹膜特征更稳定、更可靠,并且采集虹膜图像时不具有侵犯性。基于虹膜的上述特点,虹膜识别技术被认
近年来无线传感网络中的安全查询技术受到越来越多无论是学术界还是工业界的关注。无线传感器网络的特征,使得在其上有效而安全地执行查询成为一种挑战。范围查询是无线传感器
一个快速并且健壮的碰撞检测检测算法在很多领域比如虚拟现实、计算机游戏、计算机辅助设计都扮演着重要角色。近几年来,随着虚拟现实技术和分布式仿真技术的兴起,碰撞检测问
虚拟现实和系统仿真是既有区别又有内在联系的两个概念,两者之间存在交集。这个交集所构成的“虚拟仿真”在内容、理论和方法上都有新的特点和亮点,它综合了虚拟现实与系统仿