基于数据库抽样的海量数据分类算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:jacychang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对目前比较优秀的各种分类方法进行了介绍、分析和比较。在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨。实验研究表明,该算法可以明显提高海量数据库的分类效率。
其他文献
根据结冰传感器的实现原理,分析了其振动频率的温度漂移特性,介绍了软件和硬件相结合的温度补偿方法.该方法已成功应用于结冰传感器的信号处理系统中,提高了结冰检测的准确度
介绍了并行机向MIMD的发展趋势,描述了MIMD并行机上解决矩阵链乘序问题的算法,并对其复杂度进行了分析。针对处理器之间任务分配的问题,提出了一种合理分配任务的算法,并对这种算
基于MALLAT算法原理和自适应算法,设计了小波自适应算法的结构,并对算法进行了理论分析和仿真研究。仿真结果表明,小波自适应算法在传感器信号降噪方面表现出了良好的性能。
采用毛细管气相色谱法测定α-硫辛酸中环已烷、乙酸乙酯、苯和丙酮的含量。选用HP-FFAP色谱柱、程序升温、FID检测器,载气为氮气,以二氯甲烷为内标法进行定量。在选定的色谱条
在RFC 2547中定义的BGP/MPLS VPNs允许服务提供者使用他们的IP骨干提供VPN服务,使用BGP对骨干网络的路由器分发VPN路由信息,使用MPLS转发VPN流量。BGP/MPLS VPNs允许服务提供者在