论文部分内容阅读
随着电商平台、门户网站的访问量越来越大,产生的日志信息也越来越多,传统的日志文件处理方法无法满足需求。通过分析Hadoop分布式文件系统(HDFS)、并行计算框架Map Reduce和数据仓库Hive技术特点,研究日志仓库的体系结构及关键技术并建立日志数据仓库。与数据库相比,数据处理效率显著提升。