论文部分内容阅读
随着信息技术的发展,尤其是云计算、物联网、社会化网络以及信息获取技术的进步,人类逐渐步入大数据时代。数据规模的飞速增长,促使了结合计算科学和社会科学的交叉学科:社会计算的诞生。社会计算旨在利用计算机技术和社科理论搭建虚拟网络与现实社会之间的桥梁,通过对网络化数据的分析揭示网络群体的交互规律,帮助人们认识和研究社会科学的各种问题。本文围绕社会计算中的若干关键问题,从社会化网络的群体互动规律、网络虚拟社区发现和群体舆论的聚集机理三个方面入手,研究相关算法和模型,其主要创新性工作概括如下:1.针对社会化网络中的即时通信社区群体特点,分析微博社区与即时通信社区在传播范围、隐私性、实时性、用户参与度和会话特性共五方面的异同。通过对即时通信社区和微博社区的用户行为进行分析,提出群体互动指数Sj-inf和群体惰性Iinert两个驱动用户行为的动力学指标,并在此基础上,提出一种基于兴趣与群体互动驱动的行为模型ICHM。模型考虑了群体互动指数、群体惰性和个体兴趣三个影响用户行为的动力学因素。实验结果表明,ICHM生成的群体信息发布行为的时间间隔服从单一指数的幂律分布。通过参数调整可以得到与真实数据相近的幂律分布特性,与实际数据表现的动力学特征相吻合。能够为即时通信社区的群体行为特征提供合理有效的解释。2.针对传统人类动力学实证结果中出现的指数截断特性,结合即时通信社区个体之间以会话为中心的交互特性,在ICHM模型的基础上,进一步提出基于会话驱动的用户行为模型SICHM。模型基于个体会话交互原则,引入会话转移概率Ptrans和会话退出概率Pcancel约束个体的信息发布行为。实验结果表明,在会话驱动的交互行为中,个体信息发布的时间间隔服从带有指数截断的幂律分布,用户会话转移概率Ptrans在一定区间内会影响两段幂率的幂指数和截断位,当Ptrans偏离该区间范围,个体行为可以用单一幂指数的幂函数刻画。通过参数调整,模型可以生成与真实数据集一致的带有指数截断的幂律分布,表明会话驱动的特性是导致人类行为的幂律特性产生指数截断的原因之3.针对传统社区发现算法的效率问题,提出一种适用于有向网络社区发现的网络稀疏化算法。算法基于邻居节点之间的共引、传递和耦合三种关系计算其归一化相似度,并引入Minwise哈希函数提高相似度计算的效率。在此基础上,提出基于局部相似度的网络稀疏化算法LSDN。算法充分考虑网络的局部特性,使得网络在稀疏前后的入度和出度均服从幂律分布,从而保证网络稀疏前后的整体分布特性。实验结果表明,所提出的网络稀疏算法可以有效地对有向网络进行简化,能够在不改变网络整体特性的同时保证社区发现的准确度,从而提升社区发现的效率,解决了传统社区发现算法在可扩展性方面考虑不足和效率不高的问题。4.针对传统舆论演化模型忽略群体一致性压力,缺乏个体从众效应下决策行为研究的问题,分析网络群体舆论演化的驱动力,提出—种基于决策偏移的舆论演化动力学模型DO2M。模型基于社会心理学的从众效应,引入群体一致性压力和个期望牵引力,建立依从、趋同和内化三种不同节点的状态转移策略和观点演化策略。同时,基于决策偏移思想在经典有限信任模型HK模型上进行改进,构建HK-DO2M模型。实验结果表明,提出的两个模型均能够有效模拟群体舆论演化的收敛和分化,与经典有限信任模型相比,模型将个体的期望观点和实际观点分离,其观点偏移的特性更加符合社会网络中群体舆论演进和个体交互的行为特征,揭示了群体层面的观点演化的内在规律,为大数据时代分析现实舆论形成的内在机理提供理论模型和参考。