【摘 要】
:
聚类是数据挖掘领域一个被广泛研究的问题.单一的算法较难获得高的聚类准确率,甚至对于特定的数据集也很难找出最佳的方法进行聚类分析.提出了一种基于KNN的融合聚类算法(KNN
【机 构】
:
厦门大学软件学院,厦门,361005
论文部分内容阅读
聚类是数据挖掘领域一个被广泛研究的问题.单一的算法较难获得高的聚类准确率,甚至对于特定的数据集也很难找出最佳的方法进行聚类分析.提出了一种基于KNN的融合聚类算法(KNNCE),该算法基于累积k最近邻产生数据点间相似度,并通过single-link算法构建层次聚类树得到最终的聚类划分,且能够自动确定最佳聚类数,从而很好地解决以上的问题.最后,通过常用数据测试和入侵检测方面的应用表明该算法是有效的.还把它和同类算法进行比较和分析,以证明算法的优越性。
其他文献
“宁静心灵,记住快乐,抛开私利,忘掉忧愁”,这是人生四大良方。人生百年如白驹过隙,能无愧于心,无愧于天地者可为上人。“顺应天道,心无杂念,随遇而安,老有所乐”,这是晚年
近年来,网络基础设施逐步完善,同时信息技术的应用也越来越广泛.随着网络安全一系列相关问题的加重,入侵检测技术正面临着重大的机遇和挑战.因为误用检测和异常检测方法都存
细观参数的正确选取是离散元模拟成功的关键,然而,目前细观参数的选取具有一定的人为性和不确定性,导致分析结果的不可比性。利用颗粒材料单元体宏观力学参数和颗粒细观参数
在时间序列挖掘工作中,比如聚类和分类,需要计算距离来衡量时间序列样本之间的相似性,有许多研究都致力于时间序列相似性度量的研究.充分利用非线性趋势特征来进行时间序列挖
基于不同堆石料的多组大型静、动三轴试验,揭示了堆石料的特殊应力变形特性。试验发现,基于Rowe应力剪胀理论所建立的堆石料本构模型将明显低估堆石料的剪缩特性。堆石料的破
介绍了NHRI-4000型高性能大接触面直剪仪研制与运用情况。采用数字PID模糊控制方式,实现垂直荷载和水平荷载的控制精度;采用MCS51单片机控制单元和多机通信等方式,实现垂直荷
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法.可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高.将文本聚类引入自动文摘中,不但使
根据道路交通流检测节点收集的交通流数据的隐含特征,可以对分布在道路网络空间中的交通流检测节点进行空间聚类分析,使空间上关联且具有相似性质的交通流聚成一类.通过交通
建立了一种双重孔隙介质水–应力耦合模型,其特点是可考虑裂隙的组数、间距、方向、连通率和刚度的变化的影响,并研制出相应的二维有限元程序。在假定裂隙的渗透性与裂隙间距
基于无量纲计算模式,研究了极限状态方程中每个随机变量对基桩竖向承载力可靠度分析的影响,并采用最大熵原理将可靠度指标的计算转化为熵密度函数的计算。计算熵密度函数时采