面向数据流滑动窗口的随机抽样算法研究

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:vismiling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来在很多应用领域中出现了一种新的数据模式,其数据不是以传统的有限数据集形式,而是连续的数据流形式出现.数据流中的数据基本元素仍然可能是关系元组,但数据的到达是快速、时变、不可预测和无限的数据流形式,不可能完全存储原始数据,使得传统的数据库技术无法对数据流数据进行有效的管理.本文针对基于数据元素个数滑动窗口和基于时间滑动窗口,考虑其不同特点,提出了两种面向滑动窗口的随机抽样算法-SBWRS算法和TBWSS算法.理论分析和实验结果都表明这两种算法具有较强的实用性和有效性.
其他文献
到底是佛家黄金等于毒蛇?还是雷军的钱财等于人才?三十年来,笔者有幸与不少一代创业英雄或打工皇帝并肩,发觉有四个时期最值得研究:一,“起”飞(出现瓶颈);二,传“承”(出现
期刊
本文对应用于广电传媒行业内的海量媒体内容平台中的智能数据迁移问题进行了研究,以查询热度QPop增量的时间域分割升维为基础,建立了由QPop增量发现媒体内容对象应用特征的算
本文小结了为用户提供个性化服务的方法,并主要研究了其中的个性化服务发现.使用了一种新的注册模式,利用了OWL-S的语言描述能力,使服务的提供商可以详细描述自己的特色服务,
数据挖掘作为一个年轻的研究领域,已经显示出它在这个"数据丰富,知识贫乏"时代的巨大作用.在对大型数据库的挖掘方面的挑战性一直吸引广大数据挖掘人员的目光.本文在分析BIRC
本文提出了一个有效且稳定的判定聚类有效性的新指标.该指标的核心从重叠度的角度来评估类的紧凑度.指标的另一个可取之处是在量化重叠度的时候通过模糊理论来建立隶属度和交
毫无疑问,世界银行行长罗伯特·佐利克今年6月的卸任将会引爆更多的纷争。“三战”后所建立起的布雷顿森林体系中的两大国际金融机构—直有一个“传统”----世行行长总是美国
“信号太差了,只能接,不能打,一直在等你找我.”四川芦山县,4月21日晚20:30,蒋峻坐在壹基金救援联盟帐篷口,对着电话那头大喊.庞大的物资车排着队,在堵了十几个小时后,轰隆隆
越来越多的片商希望把影片卖到中国,而衡量中国电影竞争力的标准,是有多少片商想把中国电影买到自己国家发行世界影坛从未像现在这样需要中国,但不是需要中国电影。没错,它们
期刊
当计算机信息系统在遭受诸如火灾、水灾等自然灾难或人为破坏时,计算机系统的硬件、数据、系统和服务都会受到不同程度的破坏.当灾难发生在通信、金融或军事系统,如果不能够
会议
福利焦虑症是指为了得到企魄业设置的全勤奖、年终奖等,在长期的压力及自我要求较高的认知支配下,很多人会产生一种焦虑感,从而陷入无成就感、无目标等状态中。