基于不确定性数据的聚类分析研究

来源 :西南农业大学 西南大学 | 被引量 : 6次 | 上传用户:keioy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
这样的观点来表述数据之间的关系。讨论了数据场的独立性、遍历性、叠加性和衰减性。借用高斯影响函数来描述了场强函数和数据场的势。着重讨论了数据辐射因子(高斯影响函数中的影响因子)对数据场的影响。 与现实对象的相互联系和相互作用可以使用数据场来描述一样,现实世界对象的不确定性,也就造成了用来表示这些对象的数据的不确定性,不确定性包含了随机性和模糊性。在数据挖掘中,有时需要对这些具有不确定性的数据进行挖掘分析。对具有不确定性数据的挖掘就不能完全用传统的数据挖掘手段或算法,而是需要用一种能表达不确定的方法来分析这些具有不确定性的数据。传统上用概率统计和模糊函数来研究具有不确定性问题,但不管是概率统计还是模糊函数在处理分析不确定性问题时都有不足和缺陷。 人类的自然语言具有定性表达的能力,使之成为研究数据不确定性问题手段的可能,而且人们往往期望用更接近人类思维的语言和方法来表示数据挖掘出的结果和知识。自然语言能很好表达常识性知识,自然语言具有模糊的边界,可避免给出很精确的定义,如“距离远”。自然语言本身包含随机性,不同的人对于相同语言可能有不同的理解,如对“距离100米”是属于“近”还是“远”,不同的人有不同的理解。但这些不影响人们的使用和交流,所以自然语言既有模糊性,又有随机性,是二者的统一。如果能解决定量数据到定性概念间的相互转换的问题,那就可以用定性概念来表达和研究具有不确定性的数据,而云理论正是能很好实现定量和定性之间相互转换的工具。 云理论主要由云模型和云发生器组成。云模型具有宏观精确可控,微观模糊不可控的特点。其本质是云滴组成的概念云,每个云滴都会产生能量辐射,并叠加形成数据场。云模型兼顾了随机性和模糊性。它把自然语言中的模糊性和随机性有机地结合在一起。云理论中,反映定性和定量关系是用云的三个数字特征(期望、熵和超熵)来表达的。期望是在数域空间中最能够代表定性概念的点的值,反映了这个概念的云滴的云重心。期望是概念在论域中的中心值,是最能代表这个定性概念的值,它100%地隶属于定性概念。熵是综合度量定性概念的模糊度和概率,揭示了模糊性和随机性的关联性。一方面熵直接反映了在数域空间中可被概念接受的元素范围,即模糊度,是定性概念亦此亦彼性的度量;另一方面反映了在数域空间中的点能够代表这个概念的概率,表示定性概念的云滴出现的随机性。超熵是熵的不确定度量,即熵的熵,反映了在数域空间代表该语言值的所有点的不确定度的凝聚性,即云滴的凝聚度,超熵的大小间接地表示了云的离散程度和厚度。 最后,把基于数据场和云理论的聚类方法应用到重庆蔬菜基地空气质量监测分析中,用数据场的方法找出噪声或孤立点,用综合云的方法得到空气中污染物各含量的综合云的期望,用定性概念来对不同的空气质量进行划分,得到了和实际相吻合的结果,说明改进的聚类方法具有正确性和可行性。
其他文献
多功能自适应充电系统可以实现对12V/20AH和24V/20AH两种型号电池的自适应充电,可以作为恒流源/恒压流输出。系统主要包含三大部分:充电源、辅助电源、控制系统。(1)充电电源
门式刚架是目前轻钢结构中应用最广泛的一种钢结构形式。轻钢结构与传统钢结构的不同在于人们采用了各种措施来使结构耗钢量减少了很多。当前对门式刚架省钢方法的研究主要集
在灌区规划中常常需要长系列的作物用水过程资料,但是很多灌区往往缺乏这一资料。作物的用水过程与灌区的降雨和蒸发过程密切相关,而降雨蒸发资料是气象部门的基础资料,比较容易获得。然而在很多情况下,降雨、蒸发实测系列长度有限,利用实测系列的统计特性,采用随机水文学的方法对降雨和蒸发过程进行模拟,从而生成长系列的降雨蒸发资料,进而推求长系列的作物灌溉用水过程。通过对常有的随机模型的分析,认为二维季节性AR(
随着地膜覆盖栽培技术的推广,在80 年代后期我国新疆首创了膜孔灌溉,这是一项新的地面灌溉技术,其节水增产效果非常显著。该灌溉方式是将地膜平铺于畦(沟)中,从而实现利用地
本文通过对荣华二采区10
期刊