交互可视化关联规则挖掘的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:A75395100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可视化数据挖掘是数据挖掘和可视化技术的有机结合,这种结合打破了传统数据挖掘过程封闭性的特点,使得在数据挖掘过程中引入并发挥人的领域知识、形象思维能力以及控制挖掘的进程和方向成为可能。关联规则是当前应用范围最广的数据挖掘工具之一。关联规则挖掘的目标是发现大型事务数据库中项集之间有趣的规则,而传统的支持度——置信度框架的关联规则挖掘结果往往不能突出用户感兴趣的规则,其原因很大程度上在于不能发挥用户的领域知识。为此,本文一方面研究了关联规则的兴趣度,提出客观兴趣度+主观兴趣度的综合兴趣度的评测方法过滤掉用户可能不感兴趣的规则;另外一方面研究了关联规则中的一个重要概念——频繁项集的可视化途径,设计了一个体现Focus+Context信息展示理念的频繁项集可视化方案;最后在此基础上提出了一个交互式可视化的关联规则挖掘模型,揭开挖掘过程封闭的黑盒,使用户能够灵活地调节参数、控制进程、人工剪枝和标注兴趣。这种交互式可视化的技术一方面利用直观的可视化视图提供可靠、简明的信息支持;另一方面提供了丰富的交互手段,使得用户有效地参与到挖掘过程中,发挥其领域知识、体现其挖掘意图。为了验证上述模型的有效性,本论文在开放式通用数据挖掘平台MFDM(多功能数据挖掘器)的架构上,设计实现了一个交互可视化的关联规则挖掘子系统(ivAssociation)。实践证明,在关联规则挖掘的过程中引入交互式和可视化技术对于用户发现有趣的规则是有益的。
其他文献
目的分析盐酸氨溴索辅助治疗肺炎的应用及有效性。方法选择2016年7月—2019年7月期间收治的肺炎患者60例,给予两种不同的治疗方式,并且将患者分成了观察组和对照组,其中对照
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
环境民事公益诉讼可定义为任何组织和个人为了保护公共的环境利益,对违反环境保护法律,侵害公共环境权益的行为向法院提起诉讼,请求判决获得民事性质救济的行为。其特点是;第
目的探讨阿托伐他汀对血脂正常的缺血性脑卒中患者血清ET-1和NO水平及预后的影响。方法选择神经内科收入院的缺血性脑卒中且血脂正常的患者60例,随机分为对照组和他汀组,每组
目的:探究早期先兆流产现象应用血清HCG以及孕酮两项指标进行监测的价值。方法选择早期先兆流产病患86例,按血清HCG及孕酮两项指标动态监测结果与治疗情况将其分为妊娠持续组和