【摘 要】
:
图可以描述实体与实体之间的联系,以顶点和边的抽象的方式分析现实中的问题,如好友推荐、网页排名PageRank。传统的图算法假设整个图数据可以加载进单台PC内存,所以对于大规
论文部分内容阅读
图可以描述实体与实体之间的联系,以顶点和边的抽象的方式分析现实中的问题,如好友推荐、网页排名PageRank。传统的图算法假设整个图数据可以加载进单台PC内存,所以对于大规模图,如社交网络、互联网等无法处理。云计算以及分布式图算法的研究用于大规模图的处理,如Hadoop,从扩展性、容错以及开源可用性等方面发挥优势,但仍存在控制与可靠性、数据安全、成本花费以及分布式图算法的调试与优化较难的问题。针对这种情况,学术界开始研究如何使用单台PC进行大规模图数据的处理,并达到较之于分布式算法的合理时间消耗。现有的基于单台PC的图计算平台,如GraphChi、TurboGraph,已经可以进行大规模图数据的处理。但是从平台计算性能和易用性(即基于平台进行图问题的抽象)两方面都存在可以优化的方面。本文基于对图算法与最佳图表示、CPU与I/O并行性以及内存利用三方面的研究,在GraphChi基础上设计和实现了一个基于单台PC的图计算平台Hybrid Graph,使计算性能和算法抽象两部分得到改进。本文的主要工作包括:(I)研究和分析了图算法表示,以及总结出与图算法最佳匹配的图表示方法;(II)探索并证明了通过图算法与图表示格式的匹配可以提高图处理效率;(III)基于开源图计算平台GraphChi,实现了HybridGraph图计算平台。
其他文献
随着计算机技术和微电子技术的高速发展,具有可靠性高、扩展性强、开发应用程序简单等优点的基于32位嵌入式处理器和嵌入式操作系统的具备通讯能力的嵌入式系统成为当前新的发
密码分析的问题可以通过穷搜索或查表法解决。但是它们分别需要需要大量的时间与存储空间。进而,穷搜索与查表法存在比较大的局限。彩虹表密码分析算法是时间与空间两个维度
随着网络的普及,企业、政府等组织中基于网络的业务越来越多,网络安全问题的影响越来越大。为保证网络的安全,很多单位投入大量资金用于购买网络安全产品。因此,对网络安全领域的
网格代表了一种先进的技术和基础设施,是继Internet之后的又一次重大的科技进步。基于Internet的网格,时时都面临着安全隐患,网格由于其自身的特殊性,它除了应用已有的网络安
随着计算机技术的普及和进步,计算机科学可视化技术也得到了迅猛的发展,特别是矢量场可视化在流体动力学中有着广泛的应用。本文针对矢量场可视化这一课题,首先对二维的稳态
数据中心网络对计算产业的重要性日益增加。然而传统的有线数据中心存在着部署困难以及布线复杂等问题。随着60GHz科技的发展,数据中心走向了无线化,数据中心也不再依赖有线
随着自然科学与社会科学的不断快速发展,各个领域中的数据都以几何级数的增加,人们要从这些数据中找到对自己有用的数据,找出这些数据的规律,更好的利用这些数据就成了当务之急。
网络黄毒的泛滥不仅严重影响青少年身心健康,而且也给人们正常使用互联网带来了诸多不便。如何防止网络黄毒的侵害是个重要的研究课题。目前,通常的网络过滤系统都采用URL封锁
在应用业务的发展、Internet的普及和数字信号处理技术进步的推动下,基于小波的视频图像可分级编码技术研究已经成为视频压缩研究中的热点。在目前的视频压缩编码系统中,对帧
高校是我国信息化建设的重要领域。随着高校的校园数字化建设的不断深入和建设规模的不断扩大,越来越多的业务系统被不断的开发出来,例如教务管理系统、学生管理系统等等。在这