社交网络中基于内积空间坐标系的距离预测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:likkjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交软件的普及,与之相关的社交网络也逐渐成为学术界研究的热点。在对社交网络进行拓扑分析时,计算距离(定义为组成点与点之间最短路径的边的条数)是第一步。目前存在一些经典的最短路径距离求解算法,例如广度优先遍历(BFS)、Dijkstra和Floyd等。这些算法时间复杂度较高,适用于普通网络,但是不适用于社交网络这类数据规模较大的网络。基于图形坐标系的距离预测算法是目前社交网络距离预测中比较常用的算法,它通过预处理获得部分真实距离,然后借助坐标系和部分真实距离来对其余的距离信息进行预测,大大减少了计算过程的时间花销。但是现有方法只考虑了将社交网络建模为无向网络的情况,都只适用于无向网络,在有向网络中会产生较大的误差。本文针对现有方法的不足,开展了进一步的研究,提出了基于内积空间坐标系的社交网络距离预测算法。该算法在整个计算流程中使用坐标系,将社交网络嵌入到坐标系中,社交网络中的点与坐标系中的点一一对应,通过坐标唯一标识,那么求社交网络中任意点对间的距离就等价于求坐标系内对应点对间的距离。网络中节点在坐标系中的坐标计算作为整个算法最重要的部分,采用的是基于离散矩阵分解的坐标计算算法。为克服已有方法无法适用于有向网络的不足,本文提出的坐标计算方法采用奇异值矩阵分解和非负矩阵分解两种矩阵分解技术。每个节点在坐标系中由出坐标和入坐标组成的坐标对来唯一标识,计算点对之间的距离时,由起始节点的出坐标和终止节点入坐标的内积计算得来,这样就克服了距离的不对称性约束。为提高已有算法的精确度、缩短运行时间,本文提出的坐标计算方法借鉴了鲁棒性主成分分析降维去噪的思想,从原距离矩阵中还原出低秩的主要部分来消除误差和离群点,达到降维去噪的效果。除此之外,该算法将离散矩阵分解和坐标计算融合成单优化问题,两个过程是同时完成的,在一定程度上减小了误差。本文在真实的社交软件Facebook、Wiki、LiveJournal、Orkut和Gulps等数据集上对算法进行了仿真,包括功能仿真、影响算法因素仿真和扩展应用仿真,并与已有的方法进行了对比。实验结果表明,本文提出的方法与已有方法相比不仅提高了计算结果的精确性,减小了时间开销,也改善了其无法适用于有向图的不足。
其他文献
随着互联网的飞速发展,新型的对等网络应用模式已经在许多领域开始取代客户机/服务器模式。学术界和产业界对于对等覆盖网络均进行了很多的研究工作。目前,大量的研究着眼于某
虚拟现实技术应用于体育训练可以有效提高运动员的科学训练水平和运动竞技水平。现代体育需要科学技术的不断介入,采用系统量化的方法对体育运动的内在规律进行研究。本文运
近年来,随着物联网概念的提出以及相关研究应用工作的展开,物联网这一新生事物正逐渐成为继互联网以来又一个IT热点。传感网是物联网的重要组成部分,也是过去信息化建设中比
随着信息科技的快速发展,用户的需求不断增加,人们已经很难满足于坐在电脑面前获取信息与资源。用户的交互方式呈现出多样化的趋势,大量的社会性软件拓展到移动平台成为移动
随着互联网规模的爆炸式增长,作为信息检索工具的搜索引擎得到了广泛的研究和应用。据研究单个搜索引擎能找到的相关信息通常不超过互联网上所有相关信息的45%。另外,虽然现
近年来,随着网络信息技术的快速发展,无线局域网应用已经成为网络技术中的重要组成部分。现在,无线局域网已经广泛应用在高校、企业、机场等对网络移动性要求比较高的场所。无线
全自动电脑横机是一种高科技机电一体化纬编针织设备,设计者可以通过针织工艺辅助设计系统的编程来实现各种花型组织编织以及产品款式的设计。   本文在给出相关概念的基础
随着数字化社区的普及,互联网上存在众多的数字化社区应用支撑软件,然而因为这些软件使用不同的开发平台、开发语言和数据库,增加了集成的难度。Web服务的出现使得应用集成跨
无线传感器网络(Wireless Sensor Network,WSN)在节点特性以及应用环境区别于传统网络,故对节点资源最大化利用具有重要研究意义。区域覆盖是指通过研究传感器节点调度、覆盖
大多数存储系统都有严重的安全缺陷,因为数据主要是通过操作系统的访问控制机制来进行保护,用户只要绕过操作系统,物理上接触存储设备,就能随意访问这些数据。鉴于数据已成为