论文部分内容阅读
在信息爆炸的时代,全文搜索引擎必须尽快索引大量数据,以提供最佳的检索服务.本文首先分析传统独立索引的问题,以及如何通过分布式和并行索引解决这些问题.然后提出了基于映射/归约的分布式索引算法,改变了映射节点的中间数据的结构,并使用映射/归约的第二个排序函数.最后,通过实验验证了其时间和空间效率.