基于粗糙集的定性数据分析方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:sulianlwp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定性数据分析方法有着广泛的应用前景,但随着数据采集和存储技术的进步,我们开始面对日益增多的庞大数据库,由于“总体漂移”及非独立同分布数据的出现,现有定性数据分析方法急待发展与完善。粗糙集作为一种处理离散数据的数学工具,为定性数据分析方法的创新提供了一种新的视角。通过深入研究定性数据分析内容和粗糙集方法,本文从理论与应用两个方面较为全面和系统地提出了基于粗糙集的定性数据分析方法,主要探讨了粗糙集在数据描述、数据预处理、判别分析及聚类分析等方面的应用。本文创新之处:1.应用粗糙集从数据归纳推理的角度进行定性数据分析方法的研究,这使得分析方法除了数据本身之外不需要任何其他的信息,由推断到推理是方法上的根本转变。2.提出了用分类信息表S={U/R,A,V,F}描述定性数据的方法,将变量之间关系的分析转换为变量等价类之间关系的分析。提出了用关联信息系数IR(X_i,X_j)描述变量间关联关系的方法,克服了采用χ~2检验方法的不足。3.提出了基于信息熵进行变量约简的方法和对数据的关联结构进行压缩的方法。4.在引入粗糙集流向图的同时,提出了按照变量的重要性确定流向图层次的方法,避免了分析中由于流向图层次选择不当而可能出现的辛普森悖论问题。5.提出了基于信息量进行判别变量筛选的方法,并将定性数据判别分为完全确定型判别、完全不确定型判别及粗糙型判别。6.借鉴因子分析思想,提出在分析变量子集关联结构的基础上,确定最优等价类簇的聚类方法。研究表明,本文提出的定性数据分析方法,既可用于大型数据集的分析,也可以用于传统数据的分析,克服了传统分析方法的局限性,研究成果对于定性数据分析方法的发展具有一定的贡献。
其他文献
为解决高速公路长大坡路段车辙病害严重的问题,结合工程实例,分别从机理分析、沥青混合料设计、室内车辙试验研究,以及现场效果分析等方面对掺加改性剂RA的沥青混合料抗车辙能力
市域铁路建设将促进沿线土地的二次开发,影响城市空间格局。文中对成都市域轨道交通之一的成彭市域铁路交通枢纽进行了研究。在分析传统交通枢纽规划与开发的不足之后,借助成