【摘 要】
:
Web数据挖掘是以现有搜索引擎技术为基础,同时综合运用人工智能、模式识别、神经网络等各种技术。它能够从样本中提取出目标信息的特征,然后根据目标特征在进行有目的的搜寻,将
【机 构】
:
中国地质大学(北京)网络中心 北京 100083
【出 处】
:
中国计算机用户协会网络分会2003年年会
论文部分内容阅读
Web数据挖掘是以现有搜索引擎技术为基础,同时综合运用人工智能、模式识别、神经网络等各种技术。它能够从样本中提取出目标信息的特征,然后根据目标特征在进行有目的的搜寻,将搜寻到的文档提交给用户。Web数据挖掘是一种新兴的边缘科学技术,它涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,现在处在其起步阶段,国内进行这方面所做的研究较少,尤其是Web中文信息的挖掘技术在国内还没有一个比较完善的方案。论述了Web数据挖掘的流程。Web数据挖掘技术的研究有着很好的商业和实用价值,也是一个新的挑战。
其他文献
针对小型太阳能海水蒸馏装置产水速率低等问题,设计竖管降膜太阳能海水蒸馏装置,理论推导单位冷凝面积产水速率mt的计算方法,分析特征尺寸对该太阳能海水蒸馏装置单位冷凝面
研究分析无串扰传输理想模型的条件,根据高速高密度电路板中微米级、亚毫米级互连线电磁串扰特性研究需要,首次提出微米级平行互连线的测试结构设计.经射频电路理论分析推导
本文结合现在最新的网格技术,在简要探讨网格环境下的监控和数据可视化的相关问题后,分析它存在的技术挑战,然后给出我们的一种可视化原型。该原型能很好地将专门的应用程序的性
提出了一种新型的无线资源配置模型,它的特点是通过综合考虑RT和BE业务的特点通过价格调节来引导用户,最终达到最大网络效用。给出了新的网络资源分析方法即基于归一化带宽的分
近年来,在诸多行业数据大量以流数据的形式出现,例如电信公司关于通话记录的数据。这些数据充分表现着流数据的两个典型特征:1.数据以流的形式到来而非静态的存储;2.数据到来的
空间等离子体状态对航天器表面充电具有重要影响.为了利用等离子体状态参数表征可能发生的严重充电事件,研究了基于等离子体能量密度的航天器表面电位快速估计方法.首先通过
为解决毫米波人体安检图像背景区域的大量毛刺、混叠等噪声对隐匿物体识别造成的干扰问题,提出一种自适应的二次模板匹配滤波方法。首先将原始图像进行水平集二值分割,然后将分割结果作为模板对原始图像进行背景滤除,最后将滤除背景的结果作为先验图像对原始图像进行改进的双边滤波。基于毫米波成像系统的实际图像进行对比实验,验证了此算法相比于传统滤波方法的改善,并证明此算法可以针对性地滤除毫米波安检图像的背景噪声,保
软交换是一种功能实体,为下一代网络(NGN)具有实时性要求的业务提供呼叫控制和连接控制功能,是下一代网络呼叫与控制的核心。软交换是网络演进以及下一代分组网络的核心设备之
近年来,分布式天线阵列以其突破传统布阵环境限制的灵活性/高增益性成为阵列研究的热点.对于机载雷达系统,应用分布式天线阵列可以充分利用机身布阵空间资源,提高阵列的增益
在高空核爆电磁脉冲(HEMP)条件下,通过对通风直管道半径、长度、管道端口开闭及端口增加金属网,以及是否存在排气扇、排气扇个数及是否存在裂缝,包括不同长度、宽度的裂缝等