论文部分内容阅读
提出了一种基于XML的结构进行数据挖掘的算法,该方法使用现有的XML解析工具JAVADOM对XML文件进行解析,形成XML文档树,把XML中的标签按照层次作为标记路径存储起来,再对标记路径进行关联规则挖掘,得到频繁事务。通过实验表明,只有当XML的结构呈不规则时,挖掘效率才会随最小支持度的增大而提高。