基于粗糙集数据分析的智能决策支持系统研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:rockwjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能决策支持系统(IDSS)是决策支持系统(DSS)引入人工智能技术后的产物,是目前DSS的前沿研究领域,数据挖掘是提高其决策支持能力的一种重要工具和手段,研究数据挖掘的相关理论与方法及其在IDSS中的应用具有重要的理论意义和实用价值。 数据挖掘是从大量的历史数据中发现隐含的、有潜在应用价值并最终能被人理解的知识的过程。在决策领域,人们所面对的数据往往具有不确定性和不完整性,从这类数据中发现知识是一个非常困难的问题。本文从数据挖掘的基本概念入手,分析数据挖掘过程中面对的不确定性问题的特点,在深入比较多种不确定性理论的优缺点情况下提出了应用粗糙集理论的解决方案,研究丁粗糙集理论的扩展模型及计算方法、数据预处理、知识约简、决策分析等问题。具体的研究内容如下: 1、粗糙集理论扩展模型。本文从对象的不可分辨关系出发,讨论了信息系统的经典粗糙集模型,并针对经典粗糙集模型存在的对噪音敏感等缺陷,提出了基于隶属度和微差距离的可变精度微差关系(VP-MD)模型,该模型不仅能够处理含有噪音的不完全信息系统,其结果也能反映大量数据所满足的统计规律,使粗糙集理论的应用范围更广、适应性更强。 2、VP-MD模型的计算方法。本文研究了基于VP-MD模型计算粗糙集理论所涉及的数字量和集合量方法,并针对最小属性约简和最小值约简这两个NP问题提出了基于属性上下文敏感度的启发式属性约简算法—CSBARK算法和基于值核的最小规则集求解算法。前者利用微差距离计算属性的加权特征差、利用互信息计算值差,从而求出各条件属性的上下文敏感度,该值既反映了对应的条件属性的重要性,同时还反映了该属性与其它属性的关联程度;后者利用值核在生成规则过程中的重要作用,结合推理过程中的逻辑关系求解最小决策规则集,并给出了规则的评价指标支持度和信度的计算方法。 3、本文从多方面研究了数据挖掘过程中的数据预处理问题: (1)连续属性离散化。本文将离散化问题转化为分割点的寻优问题,综合考虑多个属性之间的依赖关系,利用遗传算法寻找给定区间数的最优分割点,利用粗糙集理论的基本分类思想,删除冗余分割点。 (2)概念泛化。对常用的概念树爬升方法进行了改进,利用属性的分类能力控制概念泛化程度,防止过度泛化。 (3)空值估算。对于不完全信息系统,本文利用粗糙集扩展模型,在充分考虑数 合肥工业大学博士论文 摘 要 据相容性和属性依赖性的情况下,对缺失值进行了有效的估算,既防止了删除含有 空值的对象,使系统缺少典型性,又防止出现过多的、扩展的完全系统。 4、针对已获得的最小规则集和给定的新的决策对象,本文利用对象在规则集中 的满足情况研究了一种新的对象分类方法。 5、为了提高GDSS决策能力,本文提出了将粗糙集理论与层次分析法相结合的 思想,利用粗糙集理论所确定的属性间的依赖关系,分析应用系统运行所积累的大 量数据中各决策因素、决策者对决策目标的影响,构造具有完全一致性的个体判断 矩阵和综合判断矩阵,建立自学习系统,克服决策者主观因素对决策结果的影响。 6、在上述工作的基础上,本文研究了基于粗糙集数据分析(RSDA)的智能决策 支持系统的体系结构,详细论述了RSDA-DSS的设计与实现,该系统可根据用户的 定义完成多种粗糙集模型的数据分析方法;通过实例分析了RSDA在决策支持系统 方面的应用,同时将该系统应用于疾病治疗方案的优化,拓展了RSDA的应用领域。 论文研究成果在一定程度上解决了从不确定信息系统和不完全信息系统中发现 知识的问题,为RSDA在决策中的应用提供了更加广阔的空间。
其他文献
<正> 农业是我国国民经济的基础,而土地是农业最基本的生产资料,它是极其宝贵而又有限的自然资源。我国人口约占世界人口的20%,而可耕地面积只占7%左右,而且可耕地的后备资源较少。目前我国拥有可耕地面积不足15亿亩,人均耕地面积近1.5
近年来激光模拟射击系统在军事上、民用上都得到了较为广泛的应用。它不但具有节约弹药成本、安全性好、模拟场景逼真等优点,还可以根据适用领域的不同而设置不同的场景。且
针对翅片管式冷凝器构建稳态分布参数模型,利用试验数据验证模型,换热量误差在±3%以内。利用该模型对不同结构参数下的冷凝器性能进行仿真,分析管径、翅片间距、管间距等对
<正> 为了总结和交流近几年来全国、地区、部门和企业应用经济计量方法的经验,讨论和研究广大经济研究工作者与管理工作者在实践中遇到的理论和方法问题,进一步促进和推广经济计量方法在我国经济研究和经济管理中的应用,由中国数量经济学会、中国社会科学院数量经济与技术经济研究所主持召开的“全国经济计量方法应用经验交流会”于1985年9月16日至21日在山东省烟台市举行。这是新中国成立以来举行的第一次关于经济计量方法应用的经验交流会,也是中国数量经济学会自1979年成立以来,继1983年夏天在山西省太原市
<正> 一、模型设计与参数估计梅型设计的基本出发点是以马克思主义经济理论为指导,以推广公式M_d=PO/V为核心公式,根据我国生产、分配、流通和消费等因素,综合考察它们对M_d的影响及相互影响,力求作出反映我国现实情况,对理论和实践的分析和预测有一定意义的小型模型。要说明的是在讨论货币的供给量与需求量时,考虑到市场上的实际记录都是供需的均衡记录,其所代表的是需求曲线与供给曲线的交点的值,为了区别,我尝试用名义值
<正> 本文试图用数理方法,着重从经济数量关系上分析和探讨投入产出模型系统中的直接消耗系数变化,对总产品结构影响的一般规律,并对完全消耗系数的概念做出新的经济解释。这个问题的应用背景在于定量分析某些类型的技术进步对产业结构的影响,因为实物型直接消耗系数的变化在一定程度上反映了技术水平的变化。
补体激活在免疫病理学和炎症中起重要作用,其程度反映了炎症及疾病的过程。通过检测了解哪一途径占优势(经典途径或旁路途径),可以确定疾病的病因。
本文主要是从文化哲学的角度来透视中国传统文化的基本精神。在前言中,主要是论述为何要从文化哲学的角度来透视中国传统文化的基本精神,以及从文化哲学透视中国文化精神的实质
分析了硅-蓝宝石(SOS)压力传感器的温度特性,表明测量范围较宽时,传感器的输出易受环境温度的影响,并且成非线性.提出一种基于神经网络共轭梯度算法的硅-蓝宝石压力传感器温度补