【摘 要】
:
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出
论文部分内容阅读
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的
其他文献
针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整
研究低温液体水下直接排放的传热问题,根据传热学的基本理论对传热过程进行分析与简化,分析此传热过程的特性,建立近管口水域结冰过程中温度场模型.利用此模型可计算不同的排
提出了一种新的无线信道下基于循环前缀的正交频分复用系统符号定时同步算法.该算法把连续数据流分成独立的块,通过对间隔FFT长度的两个块求相关和得到符号定时同步和粗载波频
讨论具有大量任务数的一类应用在网格系统中的资源管理和控制问题.提出了具有层次化结构的资源分配与任务调度模型,它由任务分发器和次级调度器组成.上层的任务分发器根据任务的
从微波介质陶瓷的制作中加入Ln系稀土元素微波性能显著提高这一现象出发,结合目前微波介质陶瓷三个主要体系的改性实验结果,采用了大量稀土元素在稀土化学、稀土固体材料学和
原料摩尔配比为n(TiC):n(Ti):n(Si):n(Al)=2:1:1:0.2的起始混合粉料在1 300~1 400 ℃和30 MPa压力下热压2 h制得高纯致密Ti3SiC2块体材料.添加适量铝作助剂显著加快Ti3SiC2的
根据流水线技术,将光纤通道适配器的数据传输阶段与SCSI适配器的I/O任务执行阶段按流水线技术并行执行,能充分减少系统总的处理时间,提高系统总的数据传输速度.以FC—RAID3000为例
通过8根碳纤维(CFRP)布加固补强钢筋混凝土梁的试验,研究了在不同损伤度情况下,不同碳纤维布用量对钢筋混凝土梁抗弯性能的影响与作用.结果表明:碳纤维布加固可以显著提高所
针对监控管理系统的一般要求,将其映射成具有三层结构框架的应用系统,包括前台监测层、中间数据服务层以及后台业务应用层.同时比较相关开发工具的特点,提出了一种监控管理系
对UCard动态地址总线的安全性、稳定性进行了分析,给出了动态地址总线的安全稳定性的数学模型,讨论了实现动态地址总线安全稳定性的设计方法,包括定时查询、自锁电路以及地址总