【摘 要】
:
近年来,随着新兴社交媒体的火热发展,越来越多的人们使用在线社交平台来获取感兴趣的信息,而随着用户网络规模的越来越大,在线社交平台上信息鱼龙混杂,真假难辨,这就导致在线信息系统的治理出现诸多问题。例如不实新闻大肆传播导致社会公信度降低,哄抬物价非法赢利,传播不当言论导致的舆情监控等问题,本文从以下两个小方面切入,旨在为在线信息系统的治理做出贡献。一是从信息的传播过程。在追踪一条信息的传播时,我们通常
论文部分内容阅读
近年来,随着新兴社交媒体的火热发展,越来越多的人们使用在线社交平台来获取感兴趣的信息,而随着用户网络规模的越来越大,在线社交平台上信息鱼龙混杂,真假难辨,这就导致在线信息系统的治理出现诸多问题。例如不实新闻大肆传播导致社会公信度降低,哄抬物价非法赢利,传播不当言论导致的舆情监控等问题,本文从以下两个小方面切入,旨在为在线信息系统的治理做出贡献。一是从信息的传播过程。在追踪一条信息的传播时,我们通常会缺乏有关底层传播网络的信息,信息能够扩散的重要因素在于传播者之间存在路径,而能够有效切断信息的传播路径对于控制信息扩散起着举足轻重的作用。那么如何通过观察到的传播过程重建隐藏的传播路径就是一个具有挑战性的问题。二是从传播源头去甄别新闻的真假性。虚假信息长期以来一直被视为严重的社会问题,其中假新闻是最具代表性的问题之一。当今高度发达的社交平台使得虚假新闻以惊人的速度广泛传播,对人类生活的各个方面造成了重大损害。尽管如此,社交媒体的普及也为更好地检测假新闻这一工作扮演着重要角色。充分将已有信息利用起来,并实现自动化检测假新闻成为了当前在线信息系统中另一重要问题。本文从这两方面提出改进算法,具有重要的应用价值和社会意义。具体工作如下:1.为了解决重构问题,我们基于链路预测文献中常用的静态相似性度量,提出了一种新的节点对相似性度量——时间相似性度量。该方法基于以下假设:如果两个节点在相似的时间点上接受到更多同一信息,那么两个节点之间存在连边的可能性就越大。为了实现这一假设,我们将多个独立传播过程的时间序列作为输入,通过引入时滞函数来惩罚较长的传播时间差。我们发现,根据网络的聚类系数,此时滞函数的选择会严重影响指标的重构准确性,并且我们对网络重构的静态指标和时间相似性指标进行了详细的比较分析,这一发现为复杂网络中成对节点之间的相似性概念提供了新的思路。2.本文提出了一种新颖的假新闻检测框架,即深度上下文注意力学习框架(Deep Context Attentional Learning,DCAL)。上下文信息至关重要,但是对于用在假新闻检测上的研究还不够深入。因此,我们通过迭代注意力学习为新闻内容建模,以及通过分层的用户注意力机制来生成用户上下文,旨在通过增加用户置信度的表示来消除水军评论的影响。我们在两个真实世界的数据集上进行了实验,所提出的模型优于6个最优假新闻检测技术的基准方法(在Recall指标上最大能有2.9%的提升),并且提出的方法也是可以解释的。
其他文献
随着信息科技的逐步发展,人们越来越能更加快捷方便地获取信息。但网络技术的迅猛发展与网络信息量的快速增长,却使人们逐渐迷失在大量无效信息的包围中。信息超载问题伴随着信息科技与互联网的发展逐渐被人们重视、研究,由于信息超载问题使得人们在面对海量信息时无法有效获取自己感兴趣或者对自己真正有用的信息,使得信息整体的使用效率降低。与搜索引擎依靠特定策略和算法对用户提交的关键词进行搜索不同,作为解决信息超载问
多目标优化问题在现实生活中广泛存在,这些问题具有复杂度高,不易求解等特点,传统的数学方法难以对该类问题进行很好的求解。为解决这个问题,多目标进化算法被提出来并获得了广泛应用。多目标进化算法是启发式搜索算法中的一种,在处理多目标优化问题上,该类算法表现出了良好的鲁棒性和适用性。然而,随着目标个数的增加,这些多目标优化算法的有效性将逐渐地失效。原因是当目标数大于三个时,非支配解的数量将快速的占据整个种
多目标与超多目标优化问题广泛存在于现实世界当中,处理好这些问题具有重要的现实意义。然而,这些问题具有多个需要被同时优化且可能相互间存在冲突的目标函数,导致传统的数学方法很难进行处理。进化算法是一种基于种群的启发式算法,具有较强的搜索能力,能够解决很多传统方法无法解决的优化问题,已被广泛用于求解多目标与超多目标优化问题。近年来,为处理好超多目标优化问题,学术界提出了大量超多目标优化算法(Many-o
随着我国商品经济的飞速发展,人民精神需求水平日益提高,城市商业空间愈发受到公众关注。其中,动线系统和室外公共空间不仅是设计中的主要关注点和要素,更可作为整个商业建筑的点睛之笔和亮点所在,增添城市商业中心的活力。本文以环境行为学及消费心理学作为全文的理论铺垫和基础,以空间的合理性、流畅性、趣味性和活力性的分析视角来研究现当代商业综合体动线系统及外部公共空间的设计的现状情况,并以问卷调查和实地调研的研
在金融市场,股票预测一直是投资者和学术界的热门研究话题之一。随着经济全球化和股票市场的不断成熟,发展出了多种股票投资方式。近年来机器学习在多个研究领域取得了显著的成果,其中在股票预测方向除了传统的预测方法外,研究人员提出许多新的方法,并对已有的方法不断进行改进。例如利用深度学习预测股票中使用深度卷积网络、深度Q网络以及基于LSTM(长短期记忆网络)的深度循环神经网络预测股票。还有基于SVR(支持向
强化学习是一类关键的机器学习方法,普遍应用于以目标为导向的训练环境,并基于目标在环境中自发地探索最优策略。近来已在一些领域,如游戏操控、机器人操控、车辆自动驾驶等工程应用的部分问题中,获得显著的成绩,其中包括动态规划算法,应用于已知完整的马尔可夫问题模型;蒙特卡洛算法,与时间差分算法基于无模型问题进行寻策,是本文的主要研究内容。深度学习在机器学习中作为另一大热门研究技术,使用非线性的神经网络于分析
多目标优化问题广泛存在于科学研究与实际工程应用中。由于多个优化目标之间相互冲突,单个解不可能同时使所有的目标都是最优的。因此,多目标优化问题的最优解是由多个帕累托最优解组成的集合。进化算法是一种基于种群的元启发式算法,能同时优化一组解。因此,在求解多目标优化问题时,进化算法是一种非常适合的优化算法。然而,随着多目标优化问题复杂性的变化,现有的多目标进化算法越来越难以平衡种群的收敛性与多样性。因此,
目前,物联网、边缘智能和边缘计算等技术在网络边缘上生成了大量数据,而这些日益增多的数据需要在越来越复杂的深度学习算法上进行训练,以检测、分类和预测未来事件。这个趋势在未来还会继续扩大,为了加快深度学习算法的训练速度,分布式计算正变得越来越重要。然而分布式训练在主节点与计算节点间进行着频繁的梯度交换,这使得训练承受着巨大的通信开销,并且限制了分布式深度学习的训练效率。为了降低分布式深度学习的通信开销
多任务学习作为机器学习的一个重要分支,在处理多个小样本相关联任务和挖掘相关任务之间的内在联系与共享信息等方面发挥了重大的作用。其中多任务支持向量机(Multi-task Support Vector Machine,MTSVM)是多任务学习中的一个重要的发展方向。然而现有的多任务支持向量机大多并不具备特征选择的功能,在面对高维度任务或者高噪声任务并不能达到很好的效果。此外,多任务支持向量机通常假设
近年来,预测股价对国家,社会具有深远意义而引起了研究者们广泛的关注。使用深度学习算法预测股票是该领域重要的一个分支。由于股票数据集较小,不平稳,存在不稳定性,使预测股价难度增加。并且传统的算法难以有效提取股票序列的非线性特征。随着深度学习算法的发展,循环神经网络和卷积神经网络因有较好的非线性特征提取能力而逐渐在股价预测应用中崭露头角。尽管使用传统的神经网络算法预测股价能取得一定准确度,优化算法的预