【摘 要】
:
Hadoop具有海量数据并行存储能力和高效并行计算架构,但缺乏数据建模和数据统计能力.针对Hadoop架构的数据统计分析能力的局限性,结合R语言和Hadoop框架的优点,提出一种基于R
【机 构】
:
兰州理工大学计算机与通信学院.甘肃兰州730050,兰州理工大学甘肃省中医药大数据工程研究中心
论文部分内容阅读
Hadoop具有海量数据并行存储能力和高效并行计算架构,但缺乏数据建模和数据统计能力.针对Hadoop架构的数据统计分析能力的局限性,结合R语言和Hadoop框架的优点,提出一种基于R+Hadoop环境的大数据分析及预测方法.以甘肃惠森药业电子商务平台"药材盈"采集的大数据为例,通过采用Hadoop集群并行处理中药材文本数据、RHadoop进行预处理并获取样本数据、R语言对样本数据建模,获得较为可靠的预测中药材市场价格的模型,对中药材市场价格的变化规律及影响因素进行分析和预测.采用线性模型和决策树模型对中药材大数据进行建模,并通过实验验证和比较得到预测中药材市场价格的最佳模型.
其他文献
针对闭环控制系统提出一种基于新息估计和正交投影的闭环子空间模型辨识方法.首先采用最小二乘法对VARX模型(Vector autoregressive with exogenous inputs model)进行计算得到
多年来,由于自然、社会、经营等因素的影响,再加上农村信用社本身贷款决策失误等原因,导致了大量不良贷款沉淀。面对巨额的不良贷款,依法收贷逐渐成为降低不良贷款的重要手段之一
采用多弧离子镀沉积了TiN单层薄膜和Ti/TiN多层膜,利用XRD、SEM对样品的物相结构和截面形貌进行表征,使用原子力显微镜、纳米硬度仪对其力学性能进行分析,同时采用摩擦试验机
剡昌锋,男,汉族,1974年11月出生,甘肃平凉人,工学博士,研究员,博士研究生导师。1996年6月毕业于华中理工大学机械工程学院机械制造工艺与设备专业,获得工学学士学位;2002年6月毕业于沈
乙型肝炎病毒X蛋白在细胞转化和肝癌的发生发展中具有重要作用.为了深入研究X蛋白的致癌机理构建了pTAT-GFP-X载体.该研究以克隆在真核表达载体pCMV-X质粒中的x基因为模板,设
给出了S[a,b]上不存在某种次加的非平凡连续泛函,不存在某种到赋β-范(0<β≤1)空间的非平凡的连续算子的结论.
基于Gurtin-Murdoch表面理论,采用Fourier积分变换法,讨论了具有表面效应的刚性平压头与弹性半平面摩擦接触问题,得到问题的奇异积分方程.再利用Gauss-Chebyshev求积公式,得
为研究功能梯度材料V型缺口根部裂纹尖端附近的应力场强特性,讨论了指数型梯度材料的裂纹场强特点.以双边V型缺口试件为研究对象,建立试件的有限元分析模型.基于分层法分析静
以黄芪废渣为原料,用均苯四甲酸二酐对其进行化学改性,并将其用于模拟废水中Pb2+的吸附.通过傅里叶红外光谱、扫描电子显微镜等方法对改性黄芪废渣生物吸附剂进行表征.结果表
审计质量是审计工作的生命线,从人民银行行业特点出发,我们必须树立审计风险理念,加强风险基础审计,将审计关口前移,最大限度的把住审计质量关,全面提升审计质量。