【摘 要】
:
数据规模的急剧增长使得数据挖掘越来越重要。当前的数据挖掘方法对数据的取值基本上是单一层次的,而实际领域中数据的取值可能随着用户的任务需求而需要进行适当的层次变换
论文部分内容阅读
数据规模的急剧增长使得数据挖掘越来越重要。当前的数据挖掘方法对数据的取值基本上是单一层次的,而实际领域中数据的取值可能随着用户的任务需求而需要进行适当的层次变换。由于现实中领域知识的丰富性及复杂性,可能有不同的层次变换方向及取值可利用(即多重多层次化变换MRML),而且不同取值与问题的相关性存在较大差异。因此,本文针对这类具有多重多层次的属性泛化问题展开了研究。论文的主要研究内容如下:(1)详细地讨论了领域知识的各种不同的知识表示模型,探讨了由不同知识表示模型表示的领域知识在知识发现过程各个阶段中的重要作用,展现了基于领域知识的知识发现的应用前景及所面临的挑战。(2)描述了概念层次的基本概念以及表示方法,在此基础上,构建了多重多层次属性泛化模型,表示了具体多种泛化路径的属性间的关系,并建立了基于分类的泛化模型,用于控制属性层次变换。(3)在多重多层次属性泛化模型的基础上,提出一种基于MRML泛化关系的分类规则泛化学习方法(CG DK),该方法根据具体发现任务的需求和当前实际数据库的内容,通过误分类率的控制,在挖掘的过程中选择最紧凑的泛化层次和路径对属性进行泛化,以得到符合用户个性化要求的优化的分类规则。(4)在上述研究的基础上,构建了面向分类的多重多层次属性泛化原型系统(MRML CGDK)。
其他文献
应用现代计算机技术实现电磁仿真,合理地划分计算域和自动生成网格,形象地再现不同介质之间的电磁场分布和变化情况,为后期进行FDTD分析研究提供数据支持以及可视化服务,已经
随着P2P技术的飞速发展与应用,P2P已占有互联网业务的重要一席之地。在给用户带来欣喜的同时,层出不穷的P2P应用吞噬了大量带宽,使得网络运营商陷入困境。目前,P2P流量监控系统采
为了全面提高教学质量,2003年教育部决定实施“高等学校教学质量和教学改革工程”,精品课程建设项目是“质量工程”的重要内容之一。在2007~2010三年中,需要建设1897门国家精
随着计算机网络与通讯技术的发展与广泛应用,电子邮件已经成为必不可少的通讯方式。但是,电子邮件带来的垃圾邮件问题日益严重,给人们的生活带来了诸多不便,同时也给网络安全
网格生成技术在很多领域都有广泛的应用,如计算机图形学、计算机视觉、可视化、地理信息系统和科学计算。本文主要关注科学计算领域的网格生成技术。按包含内部节点的单元数
虚拟化技术是支撑当代互联网服务的一门重要技术。随着计算机硬件的发展,NUMA(非统一内存访问体系结构,Non Uniform Memory Access)服务器被广泛采用,早期的虚拟化技术不能很
随着我军武器装备的不断更新,如何打造一支高素质的军械装备维修人才队伍,是我军现代化建设中的一个重要课题。本文紧紧围绕军械修理工教学中训练和考试这两个核心环节,开展
Web服务作为一种新兴的Web应用模式和分布式计算模型,从根本上解决了企业之间及企业内部异构系统之间的互操作和互通信问题。然而现有的主流Web服务发现方法是采用基于UDDI框
无线网络规划包括很多应该考虑的重要问题。尤其是许多研究者试图提出各种方案来提高网络的性能和效率:通过寻找最佳规划的蜂窝网络,选择节点在无线局域网(Wlans)的位置和访问