基于存在级不确定数据流聚类算法的研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:lkh007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不确定数据流聚类的特点,为改善数据流聚类的精确性,提出一种新的聚类算法——UDStream。此算法采用双时间框架,使用密度的方法为数据点聚类;采用时间窗口体现数据流的实时性的特征;引入概率阈值的概念,设置概率相似区间,更好的区分不同概率的数据集,提高聚类结果的准确性和同一聚类中数据的概率相似度;设置动态密度阈值,能够动态掌握数据流的分布特征,使聚类过程有更好的灵活性;使用不同的缓冲区,使算法具有识别离群点,同时算法改进此前算法对初始聚类的选取方法,使聚类过程在开始时就具有一个较好的聚类样本。  实验结果表明,此算法在与其他算法的比较中,聚类结果的准确性更好,同时同一聚类中的数据具有更好的相似性,使聚类结果更具有价值。
其他文献
人脸识别是计算机视觉领域的研究热点之一。近年来,针对人的性别、年龄、种族等属性的识别研究逐渐增多。其中,性别识别在人机交互、视频监控、基于内容的检索、统计信息收集
云存储具有高可用性、高通用性、高扩展性及大容量存储等特点,广泛应用于互联网空间、高清影视节目分发、教育资源共享、数字图书馆、卫星遥感数据存储等诸多个领域,是当今国
该文的目的是总结目前已经提出的一些概念、技术,进一步提出简单有效的实现IP服务质量的策略.论文首先简单总结了目前IP服务质量技术的研究现状,然后详细介绍了区分服务技术
本论文以Siemens Q3 Server中Event Processor子系统的系统分析,设计及实现为基本内容,重点讲述了Event Processor子系统的设计与实现,并对Siemens Q3 Server系统的设计与实现也
学位
20多年的实践证明,通过逆向工程而进行系统重建已经成为有效解决这一课题的重要手段.该文首先介绍了关系数据库的有关基本理论和中山大学软件研究所总结的一套以数据源向图为
学位
学位
该文首先介绍了呼叫中心产生的背景、发展历程、作用以及发展,对呼叫中心技术及组成进行了详细的分析和论述;然后针对经济型呼叫中心的建设,提出了建设原则和设计方案;最后对
实时系统是指那些严格要求对外部的输入及时做出回应的系统.由于许多实时系统是高安全性系统,所以近几十年来,实时系统的模型验证已经成为研究热点之一.我们需要检验实时系统