弹性分布式数据集相关硕士博士期刊学术论文

弹性分布式数据集相关论文

Spark中内存数据管理技术研究

Spark作为开源的大数据处理平台,其核心是弹性分布式数据集RDD(Resilient Distributed Datasets),通过将RDD以分布式的形式存储在......

学位

Spark 并行计算弹性分布式数据集自适应缓存机制数据共享

基于RDDs的分布式聚类集成算法

在大数据时代,数据规模的不断扩大,数据的多样性愈发突出,提高分布式聚类算法的结果质量逐渐成为关注的焦点.针对多数分布式聚类算......

期刊

聚类集成分布式汁算弹性分布式数据集

面向大规模中文文本分类的朴素贝叶斯并行Spark算法

针对互联网中中文文本数据量激增使得对其作分类运算的处理时间显著延长的问题,提出并实现了一种基于内存计算模型Spark的并行朴素......

期刊

中文文本分类朴素贝叶斯 SPARK HADOOP 弹性分布式数据集并行化 Chinese text classification naive Bayes s

SparkDE：一种基于RDD云计算模型的并行差分进化算法

云计算MapReduce并行编程模型广泛应用于数据密集型应用领域，基于该模型的开源平台Hadoop在大数据领域获得了成功应用。然而，对于计......

期刊

并行差分进化算法岛模型弹性分布式数据集转换操作控制操作 Parallel differential evolution Island model R

基于Spark的通用后缀树并行构造算法

通用后缀树因其优良的结构特征被广泛应用于序列匹配、最长公共子序列查找等场合。在大数据时代,待处理序列的规模往往十分庞大,这......

期刊

通用后缀树 SPARK 弹性分布式数据集子树划分子树合并构造算法

Apache Spark技术研究与应用前景分析

介绍Spark的关键技术——弹性分布式数据集及其主要的体系架构,总结Spark的应用场景,简要分析Spark未来发展以及它与Hadoop之间的......

期刊

分布式计算 MAPREDUCE SPARK 弹性分布式数据集

Spark环境下基于SMT的分布式限界模型检测

在基于可满足性模理论（SMT）的限界模型检测中，限界深度对于程序验证结果的可信性和程序验证效率具有重要影响。传统串行检测方法由于......

期刊

软件验证限界模型检测弹性分布式数据集可满足性模理论求解器 Spark框架 software verification Bounded Model Chec

Spark缓存机制和作业调度策略研究

随着互联网的高速发展,每天都会产生海量数据。如何快速且准确的从海量数据中提取高价值的信息,成为当前的研究热点,大数据处理技......

学位

大数据 Spark 弹性分布式数据集 RDD缓存作业调度策略

Spark大数据计算平台

随着互联网技术的发展,每时每刻都在产生大量的数据,数据量已成为爆炸性增长的趋势,单机难以存储和分析这些数据。面对难以处理海......

期刊

大数据 Spark 弹性分布式数据集 Spark生态圈

大数据处理技术在风电机组齿轮箱故障诊断与预警中的应用

风电机组状态监测数据具有量大、多源、异构、复杂、增长迅速的电力大数据特点。现有的故障诊断与预警方法在处理大数据时难以在保......

期刊

风电机组故障诊断故障预警弹性分布式数据集内存批处理流数据处理

云环境下求解大规模优化问题的协同差分进化算法

差分进化是一种求解连续优化问题的高效算法。然而差分进化算法求解大规模优化问题时,随着问题维数的增加,算法的性能下降,且搜索......

期刊

差分进化大规模优化协同进化弹性分布式数据集云计算

并行计算框架Spark的自适应缓存管理策略

并行计算框架Spark缺乏有效缓存选择机制,不能自动识别并缓存高重用度数据;缓存替换算法采用LRU,度量方法不够细致,影响任务的执行......

期刊

并行计算缓存管理策略 Spark 弹性分布式数据集

Spark框架中RDD缓存替换策略优化

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

期刊

缓存策略 Spark 弹性分布式数据集内存计算

并行计算框架Spark中一种新的RDD分区权重缓存替换算法

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

期刊

Spark 弹性分布式数据集缓存替换策略并行计算 RDD缓存

Spark中一种高效RDD自主缓存替换策略研究

由于并行计算框架Spark缓存替换算法的粗糙性,LRU(least recently used)算法并未考虑RDD的重复使用导致易把高重用数据块替换出内......

期刊

Spark 弹性分布式数据集缓存替换内存资源利用

基于Spark的推荐算法研究

互联网的飞速发展给人们带来了信息红利,但随着网络数据量的迅速膨胀,用户想要第一时间获得符合自己口味的信息或者服务变得十分困......

学位

推荐算法 Spark 矩阵分解隐式狄利克雷分布并行框架弹性分布式数据集加速比

基于Spark的聚类集成系统研究与设计

随着云计算技术的发展,大数据应用有了更广的扩展与延伸。大数据的价值开始日益受到重视,人们对数据处理的实时性和有效性的要求也......

学位

聚类分析聚类集成分布式计算 Spark 弹性分布式数据集

基于Spark的网络日志分析系统的设计与实现

目前互联网络的应用已经深入到企业办公系统中,企业业务时常需要依赖互联网来达成。通过网络,信息传播可以大幅降低工作成本并能极......

学位

Spark框架 Shark框架日志分析弹性分布式数据集

基于RDD的分布式粒子群优化算法

在演化计算领域,粒子群优化算法具有易实现、收敛快、调参少等优点.但是随着问题规模的增大,粒子群优化算法易陷入求解精度不高、......

期刊

粒子群优化弹性分布式数据集岛模型并行计算

大数据处理技术在风电机组状态监测中的应用

随着风电场规模的不断扩大扩大,风电机组状态监测流数据呈指数增长,而电力系统要求对生产、管理、运营能够实时监控。为保证海量监......

期刊

内存批处理流数据处理风电机组状态监测弹性分布式数据集

一种基于内存计算的电力用户聚类分析方法

随着智能电表与采集终端采集的用电数据迅猛增长,传统数据分析方法已经不能满足大数据环境下智能用电行为分析的需要。鉴于K-means......

期刊

大数据智能用电弹性分布式数据集内存计算聚类分析

基于弹性分布数据集的海量空间数据密度聚类

为了快速挖掘大规模空间数据的聚集特性,在cluster_dp密度聚类算法基础上,提出了一种基于弹性分布数据集的并行密度聚类方法 PClus......

期刊

空间数据聚类算法弹性分布式数据集 Spark

大数据处理平台比较与分析

虽然以Map Reduce和Hadoop分布式系统（HDFS）为核心的Hadoop已在大规模数据密集的商业领域成功应用,但是对于多个并行操作之间重用工......

期刊

Hadoop MapReduce HDFS Spark 弹性分布式数据集

基于Spark Streaming的快速视频转码方法

针对单机视频转码方法转码速度较慢和面向批处理的并行转码方法效率提升有限的问题,基于SparkStreaming分布式流处理框架,提出了一......

期刊

视频转码 Spark Streaming 分布式流处理 FFmpeg 弹性分布式数据集

基于Spark的CVFDT分类算法并行化研究

以提升流数据的分类挖掘效率为目标,研究将概念适应快速决策树算法（CVFDT）部署到流数据计算平台Spark上进行并行化的方案。设计了CVF......

期刊

数据流 CVFDT 并行化 Spark 弹性分布式数据集

看过本文同时还关注