多源信息系统中的决策规则挖掘研究

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户:yangliang0510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对已有的多数据源数据挖掘考虑更多的是事务数据库中关联规则的挖掘,而针对多源决策信息系统中的决策规则挖掘则很少深入研究。在数据量爆炸性增长的大数据时代,数据的采集和存储逐渐呈现出多源异构的特点。针对高维多源异构数据的存储特点,采用集中式处理很难达到特定的需求效果,而且面临数据格式不一致,数据传输量大以及数据隐私泄露等问题。因此,通过在不同数据源中挖掘局部决策规则来生成全局决策规则的方式,为解决多数据源知识发现提供了新的方法。同时,通过定义多个度量指标,可以有效度量多源信息系统中的高投票决策规则、例外决策规则等有实际意义的决策规则。本文将基于邻域粒化的思想,给出决策规则的形式化定义,从不同实际应用出发设计了多源决策信息系统中高投票决策规则、例外决策规则、以及全局决策规则的挖掘模型与算法,最后通过实验有效地验证了所提算法的有效性。本文首先介绍了多相关事务数据库中模式挖掘的研究现状,并对相关技术做了分析与比较,介绍了邻域粒化、大间隔、规则学习等相关基础理论。然后,以邻域粒化为基础,研究关于多源决策信息系统中各类决策规则的挖掘,本文主要研究成果如下:(1)利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆盖度、投票数等多种度量指标,用以挖掘满足这些度量指标的高投票决策规则,实验结果验证了所提算法能有效地挖掘多源决策信息系统中的高投票决策规则。(2)通过样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆盖度、投票数、重要度和例外偏离度等多种决策规则的度量指标,挖掘满足上述度量指标的例外决策规则。实验结果演示了多源决策信息系统中例外决策规则的挖掘过程和结果。(3)根据样本邻域粒化提出了决策规则的一般表现形式。在此基础上,基于数据源间的一致性度量每个数据源的权重。最后,构建了通过合成局部决策规则来挖掘全局决策规则的模型。大量实验结果表明所提的决策规则合成模型是有效且可拓展的。
其他文献
关于整系数多项式的因式分解问题分为二类,一类是研究其不可约的问题,另一类是可约的,在可约的情况下就要继续研究其如何进行因式分解的问题。Eisenstin判断法是判断整系数多
中国当代诗歌的语言有其自身的源流和驳杂的"传统".梁小斌的写作构成了不容忽视的一支脉流.他很早就进行了非英雄化写作和口语化探索,他以他的诗歌创作实践一以贯之地推进着
目的 构建干扰非小细胞肺癌A549细胞表皮生长因子受体表达的四种质粒,通过抑制表皮生长因子受体在非小细胞肺癌细胞株内的表达,观察RNA干扰技术抑制肿瘤细胞生长以及对表皮生长
目的调查上海市烘焙用硅橡胶制品中的挥发性物质的含量。方法参照GB28482-2012《婴幼儿安抚奶嘴安全要求》的检测方法。结果在30批次烘焙用硅橡胶制品,仅有5批次样品的挥发性
<正>注意力是人的智力的一个重要指标,是记忆力、观察力、想象力、思维力的准备状态。注意贯穿整个认知活动过程,是其他心理活动不可或缺的背景条件。蒙台梭利说过:"给孩子最
同一关联挖掘算法算法在不同性质的数据上会表现出不同的性能。针对该问题,提出一种有趣关联模式挖掘方法。介绍模式的兴趣度度量,引入兴趣度预处理过程,并将数据分为2种类型,分
<正>大学校园里,活跃着这么一个群体,他们主动接受考试的"洗礼",为的是拿到一纸高分的证书。这个群体被称为"刷分族"或"刷刷族"。在网络游戏中也有刷分一族,游戏中的刷分属于
期刊
主要分析了现阶段公路养护管理中存在的问题,通过对这些问题进行探索,总结了在实际管理过程中的改善策略,包括改善内部的管理机制、提高工作人员的专业素养和技术水平、建设
为避免蜂窝构件腹板局部屈曲造成结构失效问题,设置横向加劲肋对正六边形孔蜂窝钢梁滞回性能影响应重点研究。该文采用试验和有限元分析方法,研究在往复荷载作用下蜂窝钢梁的
随着建立全球统一的高质量会计准则的发展势态和XBRL分类标准广泛而深入的研究与应用,XBRL分类标准的认证正越来越受到重视。目前国内外理论界和实务界,都是从操作层面上来研