倒排文档压缩技巧d—gaps的改进——文档标识号重置法

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:wylaaram
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
倒排文档是信息检索系统中最普遍使用的索引机制,而索引文件的压缩能大大提高检索速度和节约磁盘空间.倒排文件压缩的传统做法是文档(标识号)间距法(d-gaps).然而,剧烈变化的间距值并不能被著名的前缀自由代码有效编码压缩.为了使间距值得到有效的压缩,本文设计了一个文档标识号重置法.模拟试验表明能更有效压缩d-gaps倒排文档.
其他文献
以5种情报学核心期刊近年来的载文为样本,对网络型引文文献的特性(网络引文的增长态势、域名分布、著录格式及链接功能等)进行了计量研究,为网络引文管理的规范化和科学化提
在全球化大环境之下,尤其是中国加入世贸组织之后,随着国际间友好合作以及经济文化交流的不断发展,中国融入全球化的程度越来越深,中国外宣文本已经跨越国界,成为文化交流的
从短信群发系统的基本原理入手,探讨了利用短信群发系统实现图书馆移动服务的可行性及优势,并构建了一个低成本短信群发系统的模型.
20世纪以来,关于教师信念的研究与日俱增,相关的研究成果丰硕。对教师信念的关注起源于人们一致认为教师信念能够预见并影响教师在课堂上的表现。应该指出,以往众多研究主要关注
随着经济全球化的发展,一直有着“一个欧洲”梦想的欧洲人在实现政治、军事、经济乃至货币一体化的今天,逐渐认识到欧洲几十个国家的高等教育体制已经严重地影响了国际间的互
随着改革开放的深入,中国的综合国力明显增强,对外的政治、经济合作日益扩大。欧盟通过制度整合、贸易发展以及共同外交与安全政策的实施,国际影响力也在不断增强。中国-欧盟
中西方不同的思维方式造成了英语和汉语在结构上的差异。英语长句子的处理是英译汉过程当中一个重要的翻译难点。英语长句多,结构复杂,而汉语短句较多,从而给英译汉中的长句