高维多媒体数据索引算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zjcamel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集制作设备的日益普及,人们越来越方便地生产图像、图形、音频、视频、动画和三维模型等多媒体数据,这些多媒体数据具有异构、非结构化、高维和动态变化等特征,给后续处理例如分类、聚类、挖掘、理解和查询检索带来巨大困难。基于内容检索方法的出现为多媒体数据查找开辟了一条新的途径,而高维数据索引是加速相似性检索的关键技术之一,也是多媒体和数据库领域的研究热点和难点。本文就是对高维索引进行深入研究,并取得了一定成果。主要包括以下两个方面:1.对基于高维索引结构M-tree的KNN查询算法和范围查询算法的近似化,分别提出基于M-tree结构的AKNNQ算法和ARQ算法。M-tree结构虽然使用过滤机制过滤不必要的分支,大大减少了计算量,但当维数较高时,性能还是急速下降。而近似检索则被认为是适合高维的算法,所以对基于M-tree的查询算法的近似化能更好的适用高维数据,以精度换取效率。ARQ算法扩展了查询的过滤的条件,更大程度上的过滤分支,减少不必要的计算。AKNNQ算法也改进的过滤条件,还对最小优先子树按某种规则排序,更快的收敛动态的查询半径,最后通过分析实验数据,证明了近似检索算法的有效性。2.对PI近似高维结构中心点选取方法的优化和选取数量的确定,提出维数区分方法以高效的查询。PI高维索引结构预计算数据集对于锚对象(permutant)集距离顺序,对数据库进行预测规整,只需精确计算少量数据就到得到大部分的正确结果。其中permutant的选取很大程度上影响了索引结构的性能,而PI结构中的随机选取方法并不能保证效率的可靠性,而permutant选取的数量也是影响效率和准确率的一个很大因素,permutant选取越多准确率越高,但同时其效率大大下降,而选取的越少效率提高了,但其准确率又得不到保证。本文就针对这两个问题作了研究,基于最佳的permutant两两之间的距离尽可能远的假设提出了permutant的几种选取方法,并在实验中验证了不同选取方法的可行性和有效性。最后提出了维数区分方法,得到最优的permutant选取数量,实验数据表明此方法在得到一个可接受的准确率下,确保选取的permutant数目最少,效率最高。
其他文献
随着互联网的发展,它已经逐步地深刻改变了我们的生活,渗透到了人类社会的各个角落,尤其移动互联网时代使互联网又经历了一次飞跃性的发展。互联网不仅与个人生活相关,更是成
仿人机器人的研究代表了机器人学的尖端水平,是一门发展迅速的综合性的前沿学科,涉及数学、计算机、机械制造、运动学等学科,是人类的最高科技梦想之一。仿人机器人具有人类外形
专利文献是具有经济价值、技术价值的战略性信息。据世界知识产权组织统计,全世界90%以上的发明创造信息都是首先通过专利文献反映出来的,90%~95%的研发成果包含在专利文献中。专利
矩阵奇异值分解作为数值计算中一个组成部分,在气象学、量子力学、生物学、医学等领域具有广泛的应用背景。其中,计算速度与计算精度是矩阵奇异值分解的两个基本问题。为了在
随着Web信息技术的日趋发展,Web信息系统已经成为人们处理工作和日常生活的一个重要平台。如何构建一个业务功能符合用户需求,系统性能稳定,用户体验友好,系统总体框架和结构
P2P(Peer-to-Peer)网络已经成为Internet上最流行的应用,但是P2P网络开放、匿名、自主等特性,使得节点可以恣意散布不可靠的资源和服务,滥用网络资源,导致节点之间缺乏信任,
在工程实践中,嵌入式系统中的系统绝大多数都需要很高的实时性,如果这样的话对于嵌入式操作系统提出了更高的实时性要求。要想使用实时操作系统内核开发嵌入式多任务操作系统,应
目前,传感器网络种类繁多,但是传感器网络之间缺乏互操作性和互通性,特定的传感器网络只能被特定的应用程序访问,造成了资源的严重浪费。由于传感器网络的异构性、信息交换方
H.264,是由ITU—T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(Joint Video Team, JVT)提出的高度压缩数字视频编解码器标准,同时也是MPEG—4第
部分容积效应是各种医学影像设备普遍存在的问题。在同一扫描层面中含有两种或两种以上不同密度的物质时,所测值是这些物质信号值的平均,不能反映其中任何一种物质的信号值。