数据挖掘的模糊系统实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhfly6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“数据挖掘”的目标是要从错综复杂的数据中去发现某种重要的模式和趋势,真正地去理解数据的内涵,模糊系统正是“数据挖掘”的一个理想的系统和方法。模糊系统有着非常灵活的数学结构,是一种高效的万能逼近器。更为重要的是,模糊系统的规则库能为我们提供许多隐藏在数据中的知识,并以规则的形式为人们所用。但是,这并不意味着模糊系统已经完美无缺。 1.现有模糊建模的许多方法仅仅是从函数逼近这个角度来研究,即如何改进函数逼近精度以及建模的速度。这只是从模糊系统是万能逼近的性质方面来进行模糊建模,如何更加充分地利用各种信息尤其是来自于数据的信息呢? 2.当面对高维数据,现有的模糊系统依然面临着维数灾难的问题:模糊规则的指数增长;大量参数需要拟合而却只有十分稀疏的数据散落在高维空间等等。 本文针对这两个问题,提出了我们自己的方法。 1.我们处理规则爆炸的基本思想来源于聚类。所谓“人以群分,物以类聚”,相似的数据被划分为一类,然后对每一类仅用一条规则进行描述。这样规则数将不会随维数的增长而指数增长,而是与数据本身的特征联系起来。 2.为了获得更为有效的论域划分,我们研究了现有的各种聚类方法,比较了它们各自的优缺点,并最终提出了两种基于MCV聚类的模糊建模新方法。 本文详细地讨论了这两种方法获取的隶属度函数的特点,以及参数估计方面的性质,并把这两种方法与其它经典的方法进行了比较。从数据挖掘这个角度看,我们的方法不仅具有很好的预测能力,还提供了更简洁的规则库,为分析问题的本质和发现数据中隐含的知识提供了更好的工具。 3.如何处理高维问题?输入选择应该是关键的第一步。它不仅起到了降维的作用,还能增加模型的可解释性并减少计算量。 我们在本文中提出了两种基于常识的输入选择方法,一种是基于灵敏度分析的输入选择,另一种是基于数据一致性的输入选择。这两种方法的出发点看似完全不同,其实是等价的,我们的分析表明了这两种方法本质上的联系,大量
其他文献
本文以我国某钢铁企业轧辊综合管理系统的研发为背景,结合系统总体开发原则及系统中优化模型的建模方法,描述了系统中工作辊配对模型、支承辊更换模型和换辊单生成技术模型,利用
发酵工程是21世纪的高新科学技术之一,它作为最早的微生物学研究领域,在过去的几百年里为人类的生产、生活和社会的发展做出了巨大的贡献。在农业、医药工业、食品工业、燃料新能源及精细化工等国民经济和人民生活方面也发挥着越来越大的作用。随着科学技术的发展和人们需求的不断提高,对于发酵产品质量的要求也不断提高,所以实现发酵过程的最优操作和控制优化成为研究热点。实现发酵过程的优化和控制,首先需要开发适用于生物
板坯库是连接炼钢和热轧生产过程的中间产品库,上游连接炼钢工序,接收连铸机浇铸生产的板坯,下游连接热轧生产线的加热炉,根据热轧计划规定的板坯需求序列为热轧生产过程供应
红外监控系统在国民经济和国防建设中发挥着重要作用,广泛应用在保安、智能交通、智能武器等诸多领域。本文针对监控系统实际应用中难以兼顾可靠性与实时性的缺点,着重讨论和