论文部分内容阅读
P2P (Peer-to-Peer)对等网络因其非中心化,自组织,动态可扩展等特点,在资源共享和内容传播方面得到广泛应用的同时,由于缺少一种严格的内容授权和第三方监管机制,造成了不良资源和盗版侵权内容的泛滥传播,正面临着一场严重的信任危机。为了深入挖掘用户节点之间版权内容共享关系,深刻反映P2P网络中版权内容的传播与分布,最终有效地进行版权内容的监管与侵权内容传播的反制,本文引入社区发现理论,提出基于行为者网络模型的侵权社区挖掘方法及监管系统。以网络中社区结构为监管对象,通过对社区内版权内容分布的研究,对社区的威胁度进行量化分析,并探索侵权社区内容传播的反制策略。通过对对等网络中侵权行为研究发现,侵权者之间相互共享和传递大量相似版权内容,这种基于内容共享和消息传递的节点组成社区的结构。社区发现技术是数据挖掘和探测性分析技术在复杂网络中极为重要的研究,在社会网络分析领域、数据挖掘和数据库技术领域、统计学和机器学习等领域有广泛的应用。本文基于行为者网络(Actor-network model)模型构建侵权社区的研究方法包含:步骤1用于网络数据的预处理;步骤2构建行为者网络模型;步骤3完成侵权社区挖掘。其中第二步包含内容相似度图的构建、节点关系联接和消息筛选及过滤等步骤。在内容相似度图构建模块,本文首先对内容元数据进行本体描述,然后进行相似度的计算,确保版权内容描述的准确性和挖掘的全面性;节点关系联接模块,记录了消息时间戳、消息频率、消息类型在内的性质完成消息权重的量化;消息筛选及过滤过程大大简化了P2P网络数据,为实施社区挖掘算法做到提前优化。第三步是在研究社区挖掘经典算法Girvan-Newman (GN)算法的基础上提出有效的侵权社区挖掘的ANMGN算法,引入社团结构增益缩短算法时间。目前,版权内容的监管一种是采取事后处理的方式,即发现盗版侵权内容后,通过采取阻止下载、文件清除等技术阻断侵权内容的传播;另一种是内容格式加密技术,符合版权方许可的用户才能下载,而这种技术并不是开源的,只适用于特定软件,没有普遍性。本文提出的基于侵权社区挖掘方法实现了对版权内容的传播流向和分布检测与监管,达到区域预警及时对侵权社区予以打击。为了解决P2P网络中的盗版侵权内容传播问题,本文在侵权社区发现的基础上,分析了社区的威胁度,对侵权社区内版权内容传播提出两种反制机制:断点反制策略和断边反制策略。版权内容传播时出现经过次数最多的节点,我们称之为桥接点,断点反制策略就是通过找到社区桥接点,在必要时删除这些桥接点,以达到阻碍版权内容向外传播;社区之间的连接边,我们称之为关键边,断边反制策略通过找到网络中的关键边,在必要时产出这些边,破坏版权内容的传播。