【摘 要】
:
随着信息时代的来临,互联网产生的大规模高维数据呈现几何级数增长,对其进行谱聚类在计算时间和内存使用上都存在瓶颈问题,尤其是求Laplacian矩阵特征向量分解。鉴于Hadoop M
【机 构】
:
云南财经大学信息学院,曲靖市公安局经济技术开发区分局
【基金项目】
:
云南财经大学研究生教育创新项目(201302);云南省教育厅自然科学基金项目(2012Z064);云南省自然科学基金项目(2010ZC095)
论文部分内容阅读
随着信息时代的来临,互联网产生的大规模高维数据呈现几何级数增长,对其进行谱聚类在计算时间和内存使用上都存在瓶颈问题,尤其是求Laplacian矩阵特征向量分解。鉴于Hadoop MapReduce并行编程模型对密集型数据处理的优势,基于t最近邻稀疏化近似相似Laplacian矩阵,设计Hadoop MapReduce并行近似谱聚类算法,以期解决上述瓶颈问题。实验使用UCI Bag of Words数据集验证所设计算法的正确性和有效性,结果显示该并行设计在谱聚类质量和性能方面达到了一定的预期效果。
其他文献
代数图论将代数和图论结合起来,促进了两个学科的共同发展.代数中矩阵理论,群论等理论促进加深了对图的组合性质的研究;在代数结构上构造各类图,如零因子图、交换图、全图等,
作为提升影视作品艺术效果的重要手段,剪辑艺术水平高低直接影响到影视作品质量。本文通过对剪辑艺术进行介绍,深入分析影视剪辑艺术的关键控制环节,并提出进一步完善剪辑艺
一、美国联邦计算机犯罪刑事立法在1984年之前,根据联邦刑法典多项条文规定,计算机犯罪被予以提起公诉.但由于计算机犯罪的独特特点,仅仅这一方法被证明是不够的.从1984年第
杜甫和李白初次相会在哪一年 ?目前公认的说法为唐玄宗天宝三、四载 ( 744-745)间。这是明清之际钱谦益改变宋人旧说而另订的新说 ;自此以后 ,学术界大抵采纳。我对这问题曾
目前我国社会的整体发展水平正在快速提升,同时科技水平也在不断地提高,这就意味着我国的有关产业的生产水平得到了非常大的提高。经过几十年的发展,我国的工业技术水平已经
应用于传动工程领域的磁流变离合器能够实现输出力矩可控及无级调速,需满足输出力矩范围、可调系数等性能指标。基于磁流变液宾汉本构特性及平行平板恒流模型,建立剪切工作模
非营利组织的非营利性质,导致了其产权制度的特殊安排:非营利组织的出资人不拥有产权,非营利组织法人对资产拥有的财产所有权也不完整。不完整的法人财产所有权导致非营利组