【摘 要】
:
电子商务网站上的虚假评论信息可能误导消费者,影响用户的购买决策,还可能诋毁商家的声誉,严重影响正常商务活动。鉴于虚假评论信息屡屡在电子商务网站上大量出现,为了保护消
论文部分内容阅读
电子商务网站上的虚假评论信息可能误导消费者,影响用户的购买决策,还可能诋毁商家的声誉,严重影响正常商务活动。鉴于虚假评论信息屡屡在电子商务网站上大量出现,为了保护消费者和商家的利益,需要对虚假评论信息进行检测和处理。现有研究往往根据评论内容、评论发布者的行为等特征对虚假评论进行识别,大多采用人工标注训练集,存在工作量巨大、部分样本难以通过语义分析和简单的行为特征进行标注的困难。为解决以上困难,我们提出了基于多特征尺度空间模型的组织发现技术。考虑到网络水军受雇于网络公关公司,通过发布虚假评论信息来赚取利润,我们认为水军成员会因相同利益,有组织地去协同发布虚假评论。为检测虚假评论,我们首先构建了用户同时出现次数模型、评分相似度模型、同品牌率模型,对构建的评论用户关系网进行处理,逐步发现其中存在的稳定网络组织;然后通过优选网络组织中的关键评论来确定网络水军,进而甄别出网络中存在的组织是否为网络水军;最终根据网络水军推测其所发布的虚假评论。在整个研究工作中,我们为了发现网络组织的存在,分析了社区发现算法的适用性;为了减少单一特征的尺度空间模型带来的误判,从不同角度总结分析了水军的行为特征、关系特征、群组行为等特征,构建了多特征尺度空间模型;为了分析不同特征尺度空间模型处理过程中网络组织结构的变化,进行了网络结构在多个尺度上的推演。整体而言,本文所提出的基于多特征尺度空间模型的网络水军组织发现方法,通过在发现的网络组织中优选所对应的关键评论,可以极大地降低传统虚假评论识别的巨大人工标注工作量。其中的多特征尺度空间,根据不同维度的特征选择可以有效地识别评论用户间的关系,较好地解决了部分评论无法进行人工标注的困难。当然本文所提出的方法存在的一些误差,为此我们特别进行了相应的误差问题讨论。
其他文献
随着网络技术的高速发展,Internet上的信息呈指数增长。人们要想在众多的信息资源中找到自己需要的信息非常困难,有时即使找到也是混有“噪音”的信息。如何能够快速地找到用户
高性能纤维增强的抗弹复合材料由于具有比强度、比刚度高并具有可设计性等优点,在装甲防护、工事防护、人体防护等领域得到了越来越广泛的应用,成为未来防护材料技术发展的重
工作流技术(WorkFlow)以其在实现业务流程的自动化上的优势而成为一个新兴技术亮点。电力两票制度是电力企业安全稳定运行的重要保证。开出工作票/操作票是一个涉及多部门,需
在信息技术飞速发展的今天,信息安全是网络应用不可避免的问题。保障信息的机密性、完整性、通信双方身份认证和不可抵赖性等成了急需解决的安全问题。安全中间件克服了传统安
非单调知识库访问控制中如何以正确的授权方式使用ASP知识库是一个非常重要、且极具挑战性的问题。回答集程序设计(Answer Set Programming,ASP)是一种主流的知识表示和推理
近几年,呼叫中心迅速发展,在企业中所占的地位越来越重要。呼叫中心是企业和客户之间的重要沟通渠道。呼叫中心的语音质量就直接影响了企业和客户关系。随着经济的发展,消费
如今,伴随着网络的快速发展和壮大,各式各样的信息也随之而来,其数量是难以估计的,其中又是以文本形式存在的数量最为巨大。对于这些数量巨大的文本信息,通过计算机的辅助,对其进行
故障树分析法始于上世纪60年代,现已成为系统可靠性和可用性常用预测方法之一,广泛地应用于工程实践中。早期故障树分析程序,由于算法和计算机处理能力的原因,对事件个数进行
目前基于J2EE平台的企业应用系统框架可谓层出不穷,主要有两大阵营:基于EJB的复杂程度较高的重量级框架和一些基于POJOs(Plain Old Java Obiects)的开源的轻量级框架。在开发过
工作流管理系统作为定义、创建和管理工作流运行的软件,其巨大的潜在市场广阔的应用领域吸引了越来越多的关注。随着网络技术的发展,新兴技术的出现使人们相信:引入工作流管理系