【摘 要】
:
全文索引的显著特点就是提供对非结构化海量数据的管理和快速查询。全文索引创建的空间效率和索引建好后的查询速度是全文索引研究领域的两大热点。本文讨论并比较了现有的几
论文部分内容阅读
全文索引的显著特点就是提供对非结构化海量数据的管理和快速查询。全文索引创建的空间效率和索引建好后的查询速度是全文索引研究领域的两大热点。本文讨论并比较了现有的几种流行的全文索引模型,介绍了一种新型的全文数据库的数据模型——互关联后继树(文中简称为IRST),并且在此基础上介绍了近期研究的一些新进展。首先在索引的查询速度上有所提高。文章先介绍了一种双排序互关联后继树(DIRST),它是在在互关联后继树模型上的改进而成。然后通过比较最新研究的双排序互关联后继树逆向区间二分查询法与已有的双排序互关联后继树正向区间二分查询法的性能,证实了双排序互关联后继树逆向区间二分查询法是目前基于互关联后继树的最快的查询方法。另外,文章还介绍了互关联后继树在频繁模式挖掘上的应用情况。通过一种互关联后继图的模型,成功的将后继树应用于频繁模式挖掘。通过与经典的FP-Growth算法比较,互关联后继树频繁模式挖掘算法在测试情况下普遍大大优于FP-Growth算法。从而证明了互关联后继树在频繁模式挖掘上也有很好的应用前景。
其他文献
随着无线通信技术的大范围部署,无线频谱成为越来越紧缺的资源。现有的静态频谱管理机制导致了频谱资源在空间维度和时间维度上的低利用率。一方面频谱资源在空间维度和时间
数字图书馆(Digital Library)在世界很多国家受到了高度关注,并取得了迅猛发展,已经成为人们获取信息与知识的重要途径。数字图书搜索则是数字图书馆必须提供的支撑性服务,本
科学技术的高速发展使信息量急速膨胀,在大规模信息可视化、远程医疗、虚拟现实、计算机辅助设计、商业营销、数字娱乐等诸多领域,用户对显示技术的要求也越来越高。主要需求
随着现代信息技术的飞速发展,信息与互联网己经渗透到人们活动的各个方面。各企业与部门大多建立了独立的信息管理系统,软件的可重用性和系统集成在现代软件开发过程中逐渐变
为了使得内蒙古IP城域网更加成熟健壮,本论文就内蒙古IP城域网在技术选择上综合考虑先进性、成熟性及良好的性价比,以网络的可扩展性和可管理性为基础,统一规划,分步实施,秉
随着计算机在各行各业应用的深入和普及,各类社会、经济、政治、国防等重要信息大量的在计算机中存储和网络中传输,围绕系统安全的研究也成为最热门的研究方向之一。由于现在的
全景图生成技术是一种基于图像绘制技术生成真实感图像的虚拟现实技术,是近年来虚拟现实重要的研究方向之一。全景图拼接是将多幅由普通相机或摄像机获得的真实场景的局部图
人体步态是人行走的姿态。它作为一种新的行为特征,具有非接触性、可感知性和非侵犯性、难以伪装和隐藏、易于捕捉等特点,而且在系统的低分辨率下、一定距离时它是唯一可感知的
随着数字图像采集技术和处理技术的飞速发展,图像己成为人们获取信息的重要途径,应用图像的相关信息对产品的几何信息做出相关评定也就成了图像处理的重要内容之一。基于单目CC
随着Internet技术的迅速发展,自然语言处理已经成为信息处理领域一个引人注目的研究热点。由于汉语的特殊性,大多数汉语自然语言处理任务都需建立在分词的基础之上,因而分词