【摘 要】
:
近年来,随着数据库在不同领域的广泛应用,用户对于信息的查询处理提出了更多元化、更高效的要求。数据查询中简单的聚合(如MAX、 MIN、 SUM、 COUNT)很容易计算,但查询获得的
论文部分内容阅读
近年来,随着数据库在不同领域的广泛应用,用户对于信息的查询处理提出了更多元化、更高效的要求。数据查询中简单的聚合(如MAX、 MIN、 SUM、 COUNT)很容易计算,但查询获得的精确结果并不足以充分表达数据的联合或空间分布情况,数据分析师通常需要对数据分布进行更深层次的洞察。金融证券信息分析、网络流量监测、传感器网络采集的实时信号、Web访问日志分析、商场购物交易等应用,由于其产生数据的无限性和实时性,用户无法存储全部数据,而只能存储数据的概要信息,因此不可能直接对原始数据进行查询处理而获得精确的结果。实际上,在许多决策分析中,查询处理并不要求有严格精确的计算结果,多数往往需要基于像分位数、略图和小波等占用空间非常小的近似概要信息来进行近似查询处理,称之为Summary查询,从而帮助决策者快速进行决策分析。因此针对基于概要结构的查询处理和分析具有更大的机遇和挑战性,在数据库应用领域具有很高的研究价值。本文正是围绕基于分位数概要的查询处理和分析技术而展开的研究。本文主要研究如何基于分位数概要结构进行近似处理查询,并对Summary查询中的多属性查询问题展开了深入的研究,提出了基于分位数概要的多值对象KNN (K Nearest Neighbor, K最近邻)算法,实验表明其是有效且高效的。全文主要的研究工作如下:(1)针对索引结构中Summary查询不能超过一个查询属性问题,采用aR树数据结构,提出了基于分位数概要的KNN算法Q-KNN及GQ-KNN,其扩展并解决了Summary查询的多属性查询问题。(2)基于真实数据集和合成数据集进行了实验分析,实验表明算法具有高精确性和可伸缩性。
其他文献
本文在学习相关网络管理和业务管理的国际标准基础上,对多域异构网络中的业务建模方法和业务质量管理技术进行了研究,总结出了一种面向客户的基于SLA的以业务质量管理为中
随着计算机技术、多媒体技术的迅速发展以及Internet 的不断扩大,图像信息变得越来越丰富,如何快速地找到需要的图像成为亟待解决的问题。基于内容的图像检索技术旨在搜索出
近年来,数据仓库和数据挖掘等新技术的迅速发展为决策支持系统(DSS)的发展开辟了新途径。将决策支持系统由传统的以模型库系统为主体,通过定量分析进行辅助决策转向由数据驱动
随着计算机网络的不断发展,网络的安全问题也日益突出,网络安全的一个主要威胁就是通过网络对信息系统的入侵。特别是存储的各种关键信息,经常遭受恶意和非法用户的攻击,使得这些
本文主要研究的切换判决问题,引入了强制接口优先、切换模式选择、接口标称带宽、小区带宽、信号强度、丢包率、网络侧接入控制、终端侧数据流量、移动预测等参数,并设计了基于
当前,Web技术在Internet上得到了广泛的应用,它支持实时的信息发布、动态的用户交互以及与后台系统灵活安全的连接。因此如何构造功能更加强大、应用更为灵活、开发更为简单的W
以计算机网络和卫星通讯技术为支撑的现代远程教育在最近的十年里取得迅速的发展,体现出时空自由、师生分离、系统开放、协作共享、资源融通的特点。但是,如何利用互联网技术面
本文围绕CDMA扩频通信理论和DWT(Discrete Wavelet Transform)变换在数字水印中的应用展开研究.从理论和实验角度深入分析其稳健性能,并提出新的水印算法.主要研究内容如下:(
应用层组播将组播的功能提升到应用层,通过端主机来实现,具有无需改变底层网络结构,部署灵活方便等IP组播无法比拟的优点,这也是著名的“端到端论点”所倡导的思想。应用层组
Internet是一个庞大的、全球性的信息服务中心,它提供了各种各样的信息服务。但随着WEB上数据的爆炸式的增长,数据信息的有用性变的越来越重要了。Web挖掘技术正是基于这一背景