基于信息熵的高维数据流聚类及其应用研究

被引量 : 0次 | 上传用户:yueyingz4l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,虽然不少学者对高维数据流处理技术进行了诸多的研究工作,但仍然存在算法效率低、存储数据量大等问题。本文在对高维数据流的特点进行全面分析的基础上,对高维数据流的降维技术、聚类算法和趋势分析方法进行了深入的研究。主要有以下几个方面的研究工作及成果:1)研究了高维数据流的特点及其应用,重点分析了高维数据流的降维技术、经典的聚类算法及其优缺点。2)提出了基于信息熵的特征投影降维算法—H-HpFit Stream。针对高维数据流维数高和已有降维算法效率低等问题,利用信息熵函数保留价值信息,同时提高降维算法效率,达到降维的目的;除此之外,该算法保存了数据流的概要数据,降低数据的存储量,方便后续研究工作中对数据的提取和调用。3)提出了改进后的数据流聚类算法—D-LFStream。针对LF聚类算法聚类效果较好但运行效率较低的缺点,采用滑动窗口处理技术,将密度算法思想引入其中,完善蚂蚁的移动规则,使蚂蚁在移动过程中更具有“方向性”,提高了算法的收敛速度。4)提出了一种改进的数据流趋势分析算法。根据实际的应用需求,基于数据流变化的剧烈程度,选择使用总体最小二乘法或指数回归算法对其进行趋势分析,从而提高了数据流趋势分析的精度,使趋势分析的结果更接近于真实数据;同时结合置信区间理论对数据流中的变化点进行异常检测,为监测对象提供早期预警和重要的决策支持。5)以桥梁健康监测为应用目标,将经过降维和聚类算法处理后的数据流应用到改进的趋势分析算法中。仿真实验结果表明,改进的算法成功实现了桥梁健康监测数据流的降维和聚类操作,能有效的进行趋势分析;同时,改进的算法不仅提高了高维数据流的处理效率,并解决了庞大数据流的存储问题。
其他文献
统计套利是一种依赖市场做空机制,基于统计模型的量化投资策略。中国于2010年3月31日正式开展融资融券业务为实现统计套利提供了可能性。统计套利在国外资本市场已经是成熟的
广州新电视塔天线桅杆是主体结构的主要组成部分,也是结构施工的关键和重点。其特殊的构造和安装位置,对安装提出了很多的课题,如特殊施工技术路线的确定、施工机械的选择、
相关资料表明,一个企业,不论是中大型企业还是小微企业,之所以能够成功,20%靠的是战略,60%是靠企业各层管理者的执行力,其余是机遇等不可控因素。在小微企业的经营管理过程中
目的探讨灌肠膏联合中药熏洗剂在溃疡性结肠炎(UC)患者保留灌肠过程中对肛门及肛管的保护作用。方法将120例应用保留灌肠治疗的UC患者随机分为4组,每组30例。治疗组在灌肠前
介绍徐经世治疗尪痹经验,认为尪痹的基本病机是寒湿流注,气血不和,筋骨受累,损及肝肾,寒湿困脾是尪痹的病机关键。选方用药上以经方为基础加减化裁,临证时要注意固护脾胃,"从
提出了运用帘子布图像的直线纹理特征,由概率统计生成灰度剖面直方统计图,有效地提取了帘子布图像的特征波形.波形特征参数对比能准确定位帘子布纹理结构的异常位置,正确识别
目的评价降脂通络软胶囊治疗高脂血症(气滞血瘀证)的有效性与安全性。方法将高脂血症气滞血瘀证患者442例随机分为治疗组313例和对照组129例。治疗组给予降脂通络软胶囊和脂
曾是"落后"代名词的大西北,而今正在从改革入手缩小与全国水平的差距。陕、甘、宁、新、青五省区现代企业制度试点工作已全面铺开,并进入实施阶段。他们试图通过企业制度创新
胎息作为道家修持的高深境界,其养生延年作用历来备受重视,但由于历史传承等原因所导致的误解亦不容忽视。在系统梳理文献基础上,明确胎息的释名内涵,澄清胎息与闭气之别,并
频繁发生的各种自然或人为因素的突发事件,给人们带来了无法估计的损失。突发事件发生后,只有通过快速、有效的应急疏散响应,才能保证有限时间内的有效疏散。因此提前制定科