【摘 要】
:
近年来,随着互联网的迅速发展,互联网上的数据越来越庞大,而且数据的种类也越来越繁杂,怎样能够有效地利用这些复杂的数据,从中发掘有价值的信息成了现今的研究热点。由于Web
论文部分内容阅读
近年来,随着互联网的迅速发展,互联网上的数据越来越庞大,而且数据的种类也越来越繁杂,怎样能够有效地利用这些复杂的数据,从中发掘有价值的信息成了现今的研究热点。由于Web上的数据没有特定的模型描述,是一种半结构化或者是无结构的数据,那么相对于传统的数据库挖掘技术而言,就存在着很多的困难。XML是一种半结构化的数据模型,可以很容易地将XML的文档描述与关系数据库中的属性对应起来,实施精确的查询和模型抽取。所以,面向XML的数据挖掘技术有着不同于传统数据库上的数据挖掘技术的特点。此外Apriori算法是一个经典的关联规则挖掘算法,但是它存在这需要频繁重复扫描数据库以及产生数量庞大的2-项集等弊端。本文在介绍了数据挖掘、Web数据挖掘、XML等一些基本概念、技术、方法、过程的基础上,完成了从XML Schema文档映射为关系模式的设计,即在基于XML的Web数据挖掘与传统的基于关系数据模式的数据挖掘算法中间建立了联系之后,对传统的Apriori算法进行了分析和改进,通过实验证明,改进后的算法获得了较好的效率和性能。
其他文献
Cu-Mn耐候钢在模拟海洋大气和模拟工业大气环境下均显示出优良的抗大气腐蚀性能,说明Cu、Mn对提高钢的抗大气腐蚀性能有着良好的协同作用。本论文工作采用多种实验手段,从锈层
草原是国家重要的战略资源,草原的合理利用与保护成为人们日益关注的焦点和迫切需要解决的问题。为此,对有限的土地资源进行登记造册,建立地籍管理信息系统,并辅以必要的调查统计
推行牛肉分级制度是促进肉牛产业发展的重要因素。我国已出台了牛胴体分级的行业标准,其中牛肉的颜色是表征牛肉质量的重要指标之一。目前,由于技术原因,对牛肉颜色等级的评
下降管式热解液化装置能够实现生物质热解液化,但是目前对于下降管内部传热机理还不清楚。由于反应器温度很高,生物质粉在进入下降管的瞬间就初步热解为半焦,因此研究陶瓷球
MAX相陶瓷兼具陶瓷和金属的优良特性,比如高的比模量和比强度、优异的化学稳定性、出色的机加工性能、良好的抗损伤容限及导电导热性等,这使得该类陶瓷成为一种非常有前景的高
我国农业机械化持续快速发展,对农机具测试提出了更高的要求。测试技术的先进性直接影响着新产品的性能和质量,以及产品更新的周期。本文通过对国内、外农机具测试现状的调查研
电力输电线路的维护管理以及故障排除对于供电安全与稳定性有重要的促进作用,是当下电力企业发展工作中核心内容之一.目前社会中生产生活各种用电需求量大增,加强对电力输电
弧焊逆变电源具有体积小、动特性好、能得到任意外特性的特点,得到广泛应用,弧焊逆变电源的开发,不仅要在设计上投入大量精力,还要在调试上付出巨大精力解决功率管烧毁和稳定性问