基于数据挖掘的商务智能技术研究与实现

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:szhzm4158
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业业务复杂度不断提升,数据规模不断扩大,商务智能系统已经成为各大行业智能信息分析处理的热点,它不仅从结构上改变了传统模式的信息系统,而且在技术上,它结合着计算机分布式计算、数据仓库、多维度数据库以及数据挖掘等技术,其实现难度比传统信息系统高出很多。本文基于作者实习公司自主研发的BI(Business Intelligence,商务智能)系统,分析其特有的分布式数据仓库体系结构,它能够满足高度可扩展性和灵活性,而且易于管理,满足软件即服务模式系统的潜在要求。在此基础上,本文从BI系统的实际需求出发,分析了系统在数据分析方法以及多维数据集的度量方法上的需求,它们都需要对存储在数据仓库中的历史数据进行分析和挖掘。根据零售行业的销售数据的特点,基于概率统计的数据挖掘方法以及根据零售规则提取的检测分析方法是最有效的数据挖掘途径。本文基于传统的Box-Jenkins方法学,对ARIMA时间序列分析及预测方法进行了实现,证明了该分析及预测方法的可行性,同时由于人为因素以及一些不可控的自然因素,预测精度受到很大影响。面对此难题,本文分析并实现了基于传统的Box-Jenkins理论的Baseline(销售基线)处理算法,该算法主要目的是排除促销、脱销、季节更换、人为及非人为因素引起的随机变化,获取最符合销售数据实际变化规律的基线。在对该理论进行改进、实现Baseline算法的过程中,实现了基于规则及概率模型的数据挖掘:脱销检测、促销分析,以及根据实际销售模型满足泊松分布的概率分布特点实现的损失估计。Baseline算法的计算结果可直接用于促销评估,同时也作为趋势预测的源数据。文中数据挖掘的另一部分为基于Baseline结果集的趋势预测,使用Rob J Hyndman等人用R统计分析语言编写的开源算法包forecast中的自动ARIMA建模方法,对海量历史数据进行了自动模型识别和分析,并基于识别模型对趋势进行了预测,由于Baseline的实现,预测结果可信度有了很大的提高。在文章的最后,本文给出了联机分析处理报表的设计和实现,将数据挖掘的结果载入多维数据库作为计量方法,并通过浏览器进行报表的创建和运行。
其他文献
人脸检测及人脸特征检测是当今模式识别领域的研究热点。人脸检测作为自动人脸识别系统的一个关键环节,开始逐步引起人们的重视。随着其应用范围的扩大,人脸检测的应用背景已
随着现代化工业生产和科学研究领域的发展,数据采集的需求日益增多,在一些要求高速率、高精度的测量领域中,如信号测量和图像处理等方面,都需要进行快速大容量的多路数据采集
带式输送带作为工矿企业生产领域最重要煤炭运输工具,具有结构简单、运输距离长、可靠性好、输送量大的特点。由于煤炭自身存在的易燃性,输送带在运输煤炭的过程中存在发生事故
随着通信技术和互联网行业的迅猛发展,以及电子智能产品的普及,嵌入式系统的应用越来越广泛。新一代全球无线通信标准LTE的提出,使得嵌入式软件平台的开发逐步成为通信领域设
任何一种基于单一特征的车辆识别技术都存在一定的缺陷,例如车牌识别技术不能保障遮挡,污损以及缺失车牌的识别率,而且也不能检测套牌等不法行为;车标识别技术不能唯一确定车
随着10个超导量子比特的计算机的实现,量子计算与量子信息的发展将会受到越来越多的关注。量子并行计算是量子计算机远远快于经典计算机最主要的因素之一,而量子相干性又是量
随着数码技术的发展和进步,数字图像采集设备采集设备在日常的生活中得到了广泛地应用,数字图像已经与日常生活紧密的联系在一起。针对数字图像进行修复的数字图像修复技术由
随着计算机技术和癌症病理诊断技术的不断进步,癌细胞图像自动分析识别技术逐渐成为现实。利用癌细胞图像自动分析识别系统对癌细胞图像进行识别判断,可以为快速准确地诊断和
基于外辐射源(广播、电视、手机等商业信号)的无源雷达系统由于良好的“四抗”性能已经受到各国雷达界的重视。利用雷达接收机对空中运动目标定位、测速、识别乃至成像等都具
啤酒行业的发展对社会经济水平和人们生活品质的提高起到了至关重要的作用。但是,我国的啤酒工业生产方式较为传统,啤酒生产过程的监控水平较低,在一定程度上影响了啤酒生产的质