多关系数据挖掘研究

被引量 : 0次 | 上传用户:yuyisea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今大多数结构化数据存储在包含许多关系表的关系数据库中,众多的分析和数据挖掘任务,如在智能分析、社会网络分析、商业数据分析、web数据挖掘等都依赖于多种多样的实体和事件的联系,因此在这样的一些应用里数据库既包含属性又包含语意关系数据,正如对待单独实体的属性一样,这些数据以一组相互连接的表形式存在于具有多个关系表的数据库中,每个表对应于某个概念实体或者关系,多关系数据挖掘(MRDM:Multi-Relational Data Mining)就是从此类数据库中找出模型和规则。传统数据挖掘算法是针对单表数据进行处理的,而多关系数据挖掘是通过分析一个关系数据库的多个表中的数据发现存在于单个表及多个表的属性值之间的关联规则的过程。多关系数据挖掘的研究领域涉及多个学科,它在由多张表构成的关系数据库中进行知识发现。挖掘由复杂或结构化对象构成的数据也属于该研究范畴,因为在一个关系数据库中,要把这些目标数据进行标准化表述需要用到多张表。多关系数据挖掘旨在将一些已存在的并较为成熟的学科知识整合在一起,如归纳逻辑程序设计(ILP:Inductive Logic Programming),知识发现(KDD),机器学习,关系数据库等等,以此来为挖掘多关系的数据生成新的方法,并为这些新的方法生成可用于实践的应用软件。本文首先对传统数据挖掘技术的功能及模式、数据挖掘的一般过程以及数据挖掘的应用和前景进行了综述。然后介绍了多关系数据挖掘,以及它的研究意义和研究范畴,总结了它的应用现状。接着详细介绍了多关系数据挖掘经典方法,包括ILP、关系决策树、基于关系距离的学习等等。最后介绍一种新的挖掘多关系数据挖掘的方法,并对其进行改进。本文针对多关系数据挖掘的一种新思维:Iceberg-cube算法的思想上,进行了改进,使其可以处理更大范围内的挖掘问题,而且可以直接应用于多关系数据挖掘。本文的主要工作和创新点在于:1.论文对数据挖掘进行综述,并介绍了多关系数据挖掘。2.论文对多关系数据挖掘的研究现状和存在的一些问题进行剖析,并对多关系数据挖掘算法进行详细阐述。3.论文提出具有更高应用范围的新算法,实验结果证明新算法效率更高而且精确度也更高。
其他文献
<正>近三年以来,长沙符合相关条件的金融机构陆续发行了专项用于小微企业、"三农"贷款的金融债券(下文简称专项金融债)。一、专项金融债券现状这几年来,地方法人机构发展速度
介绍了涡轮增压的现状、需求及方法。随着电子控制技术的发展、环保和节能的要求,为了更好地解决车用发动机的低速和加速性能,未来涡轮增压系统将与电子控制相结合,使涡轮增
从监控技术的发展来看,监控技术大致可分为三个阶段:人力现场监控、人力视频监控和智能视觉监控。目前,世界各国政府和学者都在密切关注着新一代的监控技术——智能视觉监控
社会的发展必然使人格权制度呈现出新的时代特征,作为民事权利体系的核心组成部分,人格权在整个民法体系的地位将会得到进一步的证明。对人格权现代化法律特征的探讨不仅是确
随着云计算的普及应用,信息安全已成为未来“云途”的发展重心。高校作为云计算的发祥地和实践场所,引领着信息安全的发展走势和技术路线。本文从高校私有云的通行部署运维方
目的基于PI3K-Akt-eNOS通路探讨松果菊苷(ECH)对脊髓损伤(SCI)大鼠的神经保护作用并探讨其机制。方法大鼠随机分为假手术组、脊髓损伤组、松果菊苷干预组、PI3K抑制剂LY29400
<正> 秦始皇陵东边的陪葬区内,一九七四年三月以来,先后发现三个兵马俑从葬坑,经考古勘查、试掘,推算将出土大型陶质兵马近八千件,并有大量的宴战青铜兵器及木质战车等。俑坑
舒婷前后期诗歌风格变化明显:题材上,理想、信念大题材转向生活化、个人化;语言、语体结构上,日常生活化取代了古典诗词味,单一抒情转向日常语调的述说;意象上,由传统、密集型转向杂
随着我国当前金融业的不断发展和全面开放,银行等金融业已经面临着极大的挑战,尤其在资本的约束下,我国银行业的金融业务出现了金融资本的缺乏的状况,并出现了前所未有的资本
目的对发热门诊患者的就诊心理及行为进行分析,从患者角度进一步完善发热门诊的设置。方法以我院2007年5月份到发热门诊就诊的106例病人为调查对象,采用问卷方式进行,对发热