XML的DOM树结构在WEB挖掘中的应用

来源 :四川理工学院学报：自然科学版 | 被引量 : 0次 | 上传用户：liongliong530

【摘要】

：

面对飞速发展的信息时代，WEB数据的挖掘日益重要，而传统的搜索引擎难以胜任对数据的挖掘处理。基于XML良好的结构性和层次性，提出了利用DOM树进行WEB挖掘的方法。首先利用Tidy工

【作者】

：

卢远征叶晓彤

【机构】

：

四川理工学院自动化与电子信息学院,四川理工学院网络管理中心

【出处】

：

四川理工学院学报：自然科学版

【发表日期】

：

2013年3期

【关键词】

：

WEB挖掘 XML Tidy DOM树 WEB Mining XML Tidy DOM Tree

【基金项目】

：

基金项目：四川理工学院研究生创新基金项目（y2012007）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

面对飞速发展的信息时代，WEB数据的挖掘日益重要，而传统的搜索引擎难以胜任对数据的挖掘处理。基于XML良好的结构性和层次性，提出了利用DOM树进行WEB挖掘的方法。首先利用Tidy工具库将WEB数据转换成良好结构的XML文件，简化生成DOM树，然后通过遍历解析XML的DOM树结构，提取需要的WEB信息，实现对WEB数据挖掘。实验表明，该方法能够方便地对数据进行结构化存储和信息处理。

其他文献

新形势下高校贫困生心理特征及干预机制研究

近年高校的贫困生比例日益上升,因学费、生活费逐年上涨,他们承受着经济、生活、学业的多重压力,产生了各种心理问题,给自身健康成长及高校的稳定发展带来了不利影响。本文分

期刊

高校贫困生心理特征干预机制

Creep behavior of SnAgCu solders with rare earth Ce doping

广泛的测试被执行学习在 SnAgCu 的性质上做的稀土元素 Ce 的效果焊接合金。0.03% 的增加(集体部分) 稀土元素 Ce 进 SnAgCu 焊接可以改进它的机械性质，但是稍微降低它的融化

期刊

锡银铜合金蠕变行为稀土掺杂稀土铈焊料最小二乘拟合实验数据机械性能rare earth Ce SnAgCu solder creep beha

非Armendariz环的最小阶

利用有限环的同构分类,以及两个判断Armendariz环的充分条件,讨论了非Armendariz环的最小阶数,最后得出,交换的非Armendariz环的阶数最小为4,非交换的非Armendariz环的阶数最

期刊

有限环非Armendariz环最小阶finite rings non-Armendariz ring the least order

Myisam引擎数据恢复策略

对于MySQL来说,最常用的数据引擎为Myisam和InnoDB。单位服务器使用到就是前者,在实际运维中,有时可能需要数据的修复和恢复等操作。当然,对于Myisam等引擎来说,通过数据恢复

期刊

数据引擎恢复策略MYSQL数据恢复服务器

Relationship between solid/liquid interface and crystal orientation for pure magnesium solidified in

在为纯镁的固体 / 液体的接口和水晶取向之间的关系，在单向性的团结以细胞的水晶的时尚成长，被调查。结果证明固体 / 液体的接口的精力在纯镁的细胞的水晶生长期间是最低的；并且

期刊

固/液界面晶体取向纯镁细胞晶体生长过程固化时尚水晶magnesium solidification process crystal growth

谈高职教育开放式学习环境建设

高职教育的开放式学习环境建设的基本内容就是通过建立开放式的学习理念,进而推进数字资源建设、教育技术装备建设和信息技术平台建设。其目的是通过改变高等职业教育发展模

期刊

高职教育开放式学习环境学习资源数字化

领导风格视域下高职教学团队绩效管理探析

教学团队是高职院校提高教学质量的重要力量,教学团队中的负责人则是建设优秀教学团队的关键因素。衡量教学团队领导者的领导力可将团队工作绩效与团队领导者的情商相联系进

期刊

领导风格教学团队绩效

添加CaO的准东煤中温水蒸气气化特性的研究

以内在碳捕集气化为背景,利用加压热重分析仪开展CaO对准东煤中温（700-750℃）水蒸气气化反应动力学特性的影响研究,采用氮气吸附仪对准东煤焦的比表面积进行测定,并对煤中不同

期刊

准东煤碱金属CAO水蒸气气化反应动力学

公伯峡水电站导流洞安全监测分析评价

公伯峡水电站导流洞下闸蓄水1个月后对导流洞导0＋159m-导0＋214m段进行了封堵，但导流洞导0＋214m下游段改建为右岸旋流式泄洪洞下平洞段的漩流洞、水垫塘和退水洞，为此导流洞导0＋214m

期刊

公伯峡水电站导流洞监测资料Gongboxia Hydropower Station diversion tunnel monitoring data

Desorption behaviour and microstructure change of nanostructured hydrided AZ31 Mg alloy powders

In order to optimize the dehydriding process for producing nanocrystalline Mg alloy powders by hydriding-dehydriding treatment,nano-structured as-hydrided Mg-3%

期刊

XML的DOM树结构在WEB挖掘中的应用

其他学术论文