论文部分内容阅读
品牌热度分析是传统商业智能中的重要分析方法,不同品牌的商品销量空间分布特征对于商业决策具有重要的参考价值。面对大数据量和海量组合方式,计算性能瓶颈开始显现。传统的基于关系型数据库的简单数据分析手段难以处理大规模的商业数据,现有的基于MapReduce的大规模分布式计算引擎已经能够满足大数据并行处理的需求。为了解决以上问题,设计了基于HDFS的数据存储机制和MapReduce处理算法来解决品牌热度统计问题,实现对大体量离线商业数据的高效率品牌热度时空分析。