聚类算法分析与应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:pinkoath
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,被信息产业界认为是数据库系统最重要的前沿之一,是信息产业最有前途的交叉学科。数据挖掘的方法有很多种,聚类分析就是其中常见的方法之一。 聚类分析是数据挖掘中的一个很活跃的研究领域,是指把具有某种相似特征的物体或者事物归为一类的方法与技巧。聚类分析的目的在于辨别在某些特性上相似的事物,并按这些特性将样本划分成若干类(群),使在同一类内的事物具有高度的同质性,而不同类的事物则有高度的异质性。 聚类分析算法所要完成的功能是数据挖掘过程中的聚类功能。应用决定算法的选择。基于密度和网格相结合的算法,使算法对于处理高维数据具有了更高的效率。密度和网格的结合算法放弃了距离的概念,采用将大量数据分为网格,以密度形式来描述。输入参数τ的递减变化,使算法可以自动从源数据空间中发现一些有价值的子空间,当所有的数据记录投影到这些子空间之后,能够形成具有较高点集密度的区域,从而不会导致聚类质量的下降。 实验证明,基于密度和网格相结合的算法在很多领域都取得了很好的结果,尤其是电信业,聚类分析被广泛地应用,对于提出的数据,决策人员往往能从这些挖掘出来的关系得到意想不到的启示,从而帮助他在激烈的市场竞争中取得成功。
其他文献
图像分割是计算机视觉中的关键问题之一,其应用范围非常广泛,几乎出现在有关图像处理的所有领域,并涉及到各种类型的图像。传统非模型的分割方法由于其方法本身的局部性、分割区
无线传感器网络是集成了微电子技术、计算技术、传感技术和无线通信技术的一种新型网络。它由成千上万个小型节点自组织而成,这些节点通过无线通信协作完成分布式的传感任务。
本文主要介绍一个基于统计的英文命名实体识别系统以及所采用的模型和它的实际应用。命名实体识别是信息抽取的一种形式,它的主要任务是将文本中的词分为人名、地名、组织名等
近几年来,无线局域网技术得到了快速发展,但在其上的IP(Internet Protocol)语音应用效果还不是很理想,特别是无线局域网中的结点在访问点间切换时对语音的服务质量影响很大。
EPA标准是我国工业自动化领域第一个拥有自主知识产权的现场总线技术国际标准。功能块是EPA控制系统中实现监控和控制的主要手段,可以分布到现场设备上以构筑所需要的控制系统
我国物流企业绝大部分都是中小型物流企业。由于先天功能的不足,加之物流系统复杂,涉及政府不同层次的多个管理部门、多个环节,物流企业经营管理模式跨行业的合并制度障碍凸现,所
随着大规模可编程技术的发展,将体积庞大的传统仪器改造成便携式设备已经在技术上成为可能,而USB技术的推广普及使得该技术的使用门槛降低,开发成本和开发周期都达到了一般用户
网络时代的出现和发展使越来越多的人融入到信息社会中来,各种信息的获取、知识的学习以及娱乐节目的收看等媒体信息越来越被更多的人所希望,然而多媒体服务信息量逐渐庞大,
高等院校科学技术研究在高校建设和发展中占有重要的位置,是学校办学水平的体现。科学技术研究活动信息需要及时为科研管理者、科研人员、科研成果应用者等各类人员掌握和
无线通讯的移动性和便捷性促使无线局域网(WLAN)得到越来越广泛的应用,与此同时,各种针对WLAN的攻击不断发生,建立并完善一种面向WLAN的安全标准成为亟待解决的关键问题。本文就