数据挖掘方法研究:关联和趋势分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lang_yin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了两类数据挖掘方法。全文分五个部分:引言、数据挖掘方法概述、关联分析方法研究、趋势分析方法研究和结论。在引言中介绍了数据挖掘产生的原因:数据的急剧膨胀和高度时效性与人们得不到科学决策所需要的有效信息和知识之间的矛盾;给出了数据挖掘的发展和演化过程;然后指出了数据挖掘前景,最后叙述了本文所做的全部工作。在第一章数据挖掘方法概述部分,重点阐述了数据挖掘的定义、数据挖掘方法分类、数据挖掘方法研究现状以及数据挖掘和统计学的区别与联系。指出了数据挖掘定义所包括的几层含义:面向真实数据、面向具体问题等;给出了数据挖掘方法的分类,确定了本文研究的两类挖掘方法在整个数据挖掘方法中的地位和作用;从八个方面详细总结了现阶段数据挖掘方法的研究现状;最后对数据挖掘与统计学的关系进行了讨论,指出了数据挖掘与统计学相同之处和本质区别。在第二章关联分析方法研究部分,重点讨论关联分析的经典方法和基于兴趣度的否定关联分析方法。通过一个实例,指出了经典关联分析方法在“支持度-置信度”框架下产生了错误的关联规则;并针对这种情况,提出了基于兴趣度的否定关联分析方法,对所举实例进行分析,表明该方法能挖掘出更加符合实际的、用户感兴趣的否定关联规则。该方法采用卡方统计量作为兴趣度度量,并修改经典关联分析方法:方法,以进行否定关联分析。在第三章趋势分析方法研究部分,通过对交易数据项集进行编码把原始数据转换成整数值随机变量序列,并说明了该序列为马尔可夫链,然后用频率代替转移概率,建立了一个趋势分析的模型。对超市销售数据进行分析表明该方法简单、实用,而且得到一个有趣的结果:顾客对同一产品的不同品牌的选择是没有差别的。在第四章结论部分,对本文在数据挖掘方法上的研究工作进行了总结。
其他文献
非线性算子不动点理论是非线性泛函分析的重要组成部分,它作为一种强有力的工具,在解决不动点问题,均衡问题以及极小值问题中起到了关键作用.  本文研究了伪压缩算子和不动点
2013年,Moudafi首先提出了分裂等式问题,分裂等式问题是分裂可行性问题的推广.Moudafi为解决分裂等式问题给出交替CQ算法和松弛交替CQ算法.并且证明了这两种算法的弱收敛性.之
全文的结构如下: 第一章介绍了保性能控制问题的研究背景、研究概况以及该文的主要工作. 第二章研究了一类具有结构不确定性的线性系统(连续和离散两种情况)的最优非脆弱保性
不可约矩阵是布尔矩阵家族中的重要成员.几十年来,不可约矩阵的性质一直是这一领域研究的热点,并已形成了比较完善的理论.一个不可约矩阵A,如果它的所有n-1阶主子矩阵均是可
该文提出并分析一种解决不等式约束最优化问题的修改的罚函数法,这一方法综合利用修改的罚函数和拉格朗日法.修改的罚函数法所用的罚函数消除了经典罚函数的主要缺点,修改的
t-EC/AUED码是单向错纠检错码中一类非常重要的码.该文介绍利用一些特殊性质的t-EC码重量分布来构造t-EC/AUED码的方法.主要是通过利用带全0这个特殊码字的t-EC码的重量分布
本文分五部份,在绪论部份简要回顾了金融研究理论的发展,介绍了关于金融资产价格运行基于复合跳跃——扩散过程的金融问题的研究,指出了研究此类问题的必要性。第二章主要回顾了