针对网络水军的知识图谱构造方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:fisher9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前网络犯罪具有手段多样化,互动性、隐蔽性高的特点,使得网络犯罪案件的侦破难度越来越高,采用传统的侦破方法往往耗费大量的人力物力和时间成本。面对互联网社交平台上的海量数据,如何获取其中最有价值的信息和如何利用这些信息生成具实用价值的知识图谱便成为一个难题。在各类网络犯罪黑产中,网络水军作为最广为人知的一种网络犯罪行为颇具代表性。早在BBS时代,“灌水”一词就已出现,如今在各大论坛,微博,qq群组都能看到他们的身影。网络水军传播大量无价值信息,违法信息,诱导舆论导向,扰乱网络安全秩序,造成网络资源的极大浪费,始终是一个令论坛管理员和网络工作者头疼的问题。本文以网络水军为例,提出了一种基于社交平台(以QQ为例)的知识图谱构造方法,分为数据收集部分和数据分析两大部分。在数据收集部分,本文设计并开发了专门用于和网络水军进行自动聊天对话的AI程序,利用该程序主动和水军行业嫌疑者进行一对一的对话来获取最有价值的第一手资料。在数据分析部分,本文设计了动态知识图谱生成算法,并以聊天记录文本为数据源,大大提高了知识图谱的针对性和准确性。本文设计的AI程序主要由有限状态机(FSM)、对话管理器和知识库三大模块构。FSM进行最基础的对话控制;对话管理器运用了经语料库训练的word2vec模型来进行自然语言处理,进而对对方的消息进行语义分析和识别,是整个程序的核心模块;知识库包含了大量水军相关对话文本,以从相关论坛抓取的回帖记录为基础,通过聚类算法生成。对话管理器通过检索知识库中的数据实现对某些问题的回应和对突发情况的处理。数据分析部分通过提取数据中的实体和实体之间的关系,将实体和关系矩阵化,进而得到大量结构紧凑的知识图谱。为了保证知识图谱能随着数据源不断更新,本文还设计了紧凑型知识图谱的合并算法,在数据更新过程中将新生成的紧凑型知识图谱不断与已有图谱合并,使得知识图谱的内容和规模也随之不断丰富和扩展。最后,本文根据生成的知识图谱和对收集到数据的分析,总结了当前网络水军行业的现状,组织方式和运作手段,具有一定的现实意义和参考价值。
其他文献
随着科学技术的发展与社会的日益进步,一些高新技术的应用给各行各业带来了不一样的活力,其中无人机技术与人工智能技术是众多高新技术中比较热门的两种。在社会生产生活中,无人机技术被应用于多个行业,例如:农药喷洒、地形勘探、交通疏导、电力设备巡检、病虫害防治、山林防火等,涵盖人们日常生产生活的各个方面。如何将两种技术融合使用,成为了科研人员们的重点研究方向,基于深度学习的目标检测和无人机结合成为了一种常用
博弈的实质在于决策,而决策所依据的指标是优化。本文主要在多玩家非合作博弈的理论框架下,考虑分布式Nash均衡求解问题。一般来说,多玩家非合作博弈系统主要包括:玩家集合,玩家系统以及每个玩家的收益函数。每个玩家的收益函数与其它玩家的状态息息相关,正是由于这种相关性,产生了多玩家互动。非合作博弈系统下的多个玩家在进行互动时,需要考虑三个问题:其一是观察游戏的状态以及环境信息;其二是估计预期的效果;最后
高延性纤维增强水泥基复合材料(Engineered Cementitious Composites,ECC)具有优异的韧性和裂缝控制能力,目前对ECC的力学性能与耐久性能研究较多,但对其弯曲疲劳性能,特别是疲劳破坏过程中裂缝发展规律的研究较少。因此本文对ECC及其组合结构的弯曲疲劳性能进行了试验与分析,主要研究内容如下:1、纤维体积掺量与粉煤灰用量对ECC弯曲疲劳性能的影响以粉煤灰用量与纤维体积掺
四氢嘧啶是细菌、真菌和一些古细菌中广泛合成的,用来应对高盐度、高渗透压和极端生长温度的相容性溶质。四氢嘧啶因其具有优良的抗逆保护特性在生物技术,皮肤护理和医学中具有广泛的应用潜力。盐单胞菌Halomonas hydrothermalis Y2是一株分离自造纸废液,在废液中高盐强碱的环境下占据生存优势的菌株。基于实验室前期对H.hydrothermalis Y2的在三个不同pH(pH6,pH8,pH
生物柴油被认为是传统化石柴油的优秀替代品,具有无毒、环保、可再生和易降解等优点,近年来受到国家大力扶持而迅猛发展。以碱土金属氧化物为代表的固体碱催化剂凭借其自身选择性好、催化活性高、无设备腐蚀、易分离回收、可循环使用且反应条件温和等优点,一直是生物柴油催化剂领域的研究热点。同时,硅灰石廉价、无毒、耐酸、耐碱、热稳定性好,是潜在的催化剂载体。本文在国家自然科学基金(51876106)、山东省重点研发
在能源、制冷、石油化工等行业中,蛇形管作为基本的流动和换热元件有着广泛的应用。换热设备设计和运行时,需要对换热元件的流动状态和传热特性做出比较准确地预估。准确地泵功设计不但能够提高换热设备的能源利用率,而且能够保证设备的安全运行。目前,蛇形管流动换热设备的工程应用很广泛,但是由于蛇形管设备内气液两相流流动特性较为复杂,研究成果较少,本文以实验的方式围绕蛇形管内气液两相流的流型以及压降展开研究。本文
近些年,有机半导体材料由于其质量轻、柔性好,易生产,取材环保等优点,成为有机场效应晶体管、有机太阳能电池、有机发光二极管等当下众多领域的研究热点。随着技术的日趋成熟,有机半导体器件在人们的日常生产生活中已经开始崭露头角,在许多领域由于其优越的性能,逐渐成为当下市场新宠。而为满足应用场景的多样化需求,人们希望得到功能更加丰富,适用范围更广的有机材料。在此背景下,共晶工程作为一种最简单有效的方法,综合
电力与我们生活中的各个方面都息息相关,电力系统的平稳正常地运行对于我们的生产与生活来说具有重要的意义。电力系统运行中一个不容忽视的问题就是电力故障的发生,由于各种电力故障而导致的停电现象,往往会对社会生活造成意想不到且巨大的损失,而电力设备自身发生问题是导致电力故障的一个常见原因。为了保证电力系统正常的运作,减少电力故障发生的频率,就需要工作人员定期地对设备进行维护与检修,而每一台设备的状况都不相
随着数字信息社会的兴起,人工智能包含在2018年政府的工作报告中,深入到生活的方方面面,尤其是在教育领域中,面向中小学生全面实施人工智能教育已成为时代发展的必然趋势。本研究在已有的人工智能教育案例基础上,将项目式与人工智能学习平台Machine learning for kids相结合,构建针对小学人工智能教育的项目式教学模式,依据此模式设计案例并进行了实验,为人工智能教育在小学阶段的开展提供一定
传统的正交异性钢桥面常采用沥青混凝土铺装层,由于沥青类材料的热稳定性较差、弹模较低,因此容易发生桥面铺装损坏、钢结构疲劳开裂两大典型的病害。而高韧、高耐久性混凝土材料的出现则为解决上述难题提供了新的思路,其中以超高性能混凝土(UHPC)和纤维增强水泥基复合材料(ECC)最具代表性。国内对于UHPC钢桥面铺装体系的研究较多且较为成熟,已在广东肇庆马房大桥、武汉军山长江大桥和南京长江五桥等大跨桥梁中成