社交网络中特定群体发现技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xiaopp1920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,社交网络应用得到了迅速普及,覆盖大部分人群。社交网络方便了人们的生活,然而社交网络中也出现了一些有害群体。这些有害群体利用社交网络应用进行沟通和交流,很可能会产生严重的不良后果。群体发现是社交网络研究中的重要课题之一。研究群体发现可以帮助理解社交网络中的群体的结构特征,群体形成的机制,而且可以根据群体发现结果对有害群体进行必要的引导和管控,减少这些群体行为的有害影响。针对如何在社交网络中根据群体初始节点快速而准确地发现所有特定群体节点这一问题,进行了研究,为特定群体发现提供了新思路。社交网络图是一种典型的图数据结构,其节点有大量的文本内容,这些文本内容代表了节点的属性信息。为了更好地利用节点属性信息,提出基于图神经网络的特定群体发现算法,因为图神经网络能够很好地聚合图结构信息以及图节点属性信息。使用词频分析的方法利用社交网络文本对用户进行建模,对初始节点进行特定群体属性子空间挖掘,利用属性子空间上的焦点属性进行特定群体发现,使用正例和无标记样本学习(positive-unlabeled learning)的装袋算法(bagging),构建一系列图卷积网络分类器,取这些分类器的平均结果作为群体发现结果。针对初始节点数目过少的情况,提出基于伪标签策略的特定群体发现算法。利用基于图注意力机制的图自编码器将社交网络节点嵌入到低维向量空间,对节点嵌入向量运行聚类算法,选择高可性度的节点分配伪标签,用伪标签节点作为样本训练图卷积网络分类器进行特定群体发现。在不同类型网络上进行了实验,发现两种算法在简单网络上能达到超过0.9的准确率,在复杂网络中也能达到较好的效果。
其他文献
在计算存储分离数据库中,数据库的输入输出(Input/Output,IO)瓶颈转向计算节点与存储节点之间的网络IO和存储节点的磁盘IO。缓存技术用来平衡CPU与IO之间的处理速度鸿沟。由于不同负载对缓存的需求不同,一成不变的缓存配置在不同负载下会存在影响性能和浪费资源的问题,因此需要根据不同负载对计算存储分离数据库中各节点的缓存进行参数配置,从而在合理利用资源的基础上提升节点提供服务的能力。通过对
学位
随着视频数据量的爆炸式增长,通过深度学习算法进行视频的分析渐渐变成了热门方向。本课题基于云服务构建了一套监控视频的分析系统。对视频分析的核心算法的处理主要有两个步骤。首先针对模型训练阶段,其中很多步骤需要人工干预,同时依赖专家经验。而自动机器学习可以使这些步骤自动的完成,同时得到性能良好的模型。本课题基于NNI的自动机器学习工具进行模型的自动超参数调优,同时在模型的推理阶段,基于Triton In
学位
随着航天技术和计算机技术的发展,遥感技术实现了蓬勃发展的趋势,怎么样对海量的遥感图像进行处理并且从中获取有效的信息,已经成为遥感领域的核心问题。在遥感领域中,对遥感图像的有效地物分割是遥感技术研究的基础,也是领域中的热点问题,因此从遥感图像中得到有效地物分割结果图是遥感技术发展的重中之重。基于深度学习的地物分割方法能够提取遥感图片中定位信息和语义信息,从而对遥感图片实现端到端的地物分割。采用深度学
学位
基于图像的三维重建是计算机视觉领域的一个重要研究方向,而多视图立体视觉作为其中最为高效鲁棒的方法,得到了非常广泛的研究。传统的多视图立体视觉通常可以重建出精度较高的模型,但是依赖于手工设计的特征描述子与代价函数,这难度较大并且处理效率通常不高。最近,一些基于深度学习的多视图立体视觉方法也展现出可以与传统方法相比较的重建质量。但是由于模型的复杂性,目前这些方法生成较低分辨率深度图的同时占用大量的显存
学位
随着科学技术的发展,人脸三维重建技术在计算机图形学领域越来越重要,该技术在人机交互、电影、3D游戏等领域有着广泛的应用。在虚拟人物的面部动画中,如何使人脸口型动作和语音保持同步一直是研究热点。为了重建出语音对应的口型,需要进行语音特征分析,口型特征分析和口型重建等过程。传统方法在重建口型时,无法在保证匹配精度的同时兼顾制作效率,这使得良好的口型动画制作过程效率低且成本高。本文对三维人脸的语音和口型
学位
随着现代社会计算机的不断发展,全行业信息化数字化进程的不断推进,图数据的规模也在不断增长。在如此庞大驳杂的图数据中如何提取有用的信息即图挖掘则具有着重要的意义。并且,社交网络的兴起也促使图数据内各种社区的形成,而在其中挖掘出具有特定特征的社区,很多情况下更是NP难问题,不易设计出高效算法。同时,图数据内,时态图因其特殊的时间属性,逐渐代替传统的普通图,成为了社区搜寻领域活跃的研究对象。极大持久社区
学位
图是一种较为复杂的数据结构,在计算机科学中,图是由顶点和边构成的集合。在实际的生活中,常使用图数据结构来描述数据间的关系。诸如网页之间的链接关系,蛋白质分子的组成,社交网络关系等,都是通过图数据结构的形式呈现。作为数据挖掘领域中的一部分,图数据挖掘在这些年引起了广泛的关注。随着图数据规模的不断增大,用户需要一个系统用于对图进行管理和挖掘。因此,如何设计一个高效的图数据挖掘系统,已成为当下研究的重点
学位
随着互联网的不断发展,社交网络用户越来越多,人们日益热衷于参与各种社交网络活动。因此,如何从多个社交网络中找出其中的相同用户是一个非常有价值的工作,这一任务在跨网络推荐、敏感人群定位等各种工作中都体现着很重要的价值,这一任务也被称为网络对齐。当前网络对齐的解决方法一般分为两步:一、社交网络嵌入:因为社交网络是一个非常复杂的结构,直接在社交网络上执行计算是非常困难的。因此,通常先将网络嵌入到一个低维
学位
卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习(Deep Learning,DL)最重要的算法之一,采用权值共享的网络结构,降低了网络的复杂度,被广泛应用于计算机视觉等领域。传统的卷积神经网络主要基于中央处理器(Central Processing Unit,CPU)或图型处理器(Graphics Processing Unit,GPU)进行实现。目
学位
近年硬件的快速发展使得其计算能力不断提高,深度学习中新的神经网络算法的提出使得目标检测飞速发展,实时性和准确性都有了很大的提升。然而就车辆和行人多目标检测场景而言,第一模型依赖于强大的算力;第二模型在视频检测中相邻帧之间候选框会出现闪烁问题;第三模型在测试端会出现大量的冗余数据。这将为车辆和行人的检测的实际应用带来极大的困扰。因此,优化车辆和行人的检测算法对解决上述问题兼具理论和应用价值。针对以上
学位