倒排表相关论文
今天,随着信息时代的到来,存在着大量的数字信息.它们的存在增加了我们获得信息的方式.但也存在下列问题:(1)由于信息提供商的不同......
本文就中文全文检索的不同算法模型,特别是基于分词和基于单字的不同全文检索算法进行了比较,分析了各自的优缺点和实现的难点,针......
资源描述框架(Resource Description Framework,RDF)是W3C组织提出的描述万维网上资源的通用模型,该模型已广泛应用于诸多领域,如语义......
目前的搜索引擎大多是综合性的,收录各方面、各学科和各行业的信息,在反映专题或专业化信息方面很难做到全、快、准。因此课题完成......
倒排索引是提高检索效率的重要技术,如何平衡倒排索引的空间效率、动态性能和检索效率是倒排索引面临的关键问题。本文主要围绕动......
全文检索系统支持快速从海量文本数据中检索信息,具有重要的应用价值。全文索引模型是全文检索系统的核心,它决定了全文检索系统的......
WWW上大量信息的涌现,对信息的查询提出了严峻的挑战.XML作为一种扩展标记语言,具有许多HTML所不具备的优点,使得开展WWW上的深层应用成为可能.对基于......
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压......
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组......
倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据......
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不......
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的......
对全文检索倒排表技术作了较细致的研究。对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词......
跳跃索引是一种可信赖性索引,但只能为严格单调递增的序列建立索引,不能处理非顺序序列.为了解决这个问题,文中提出了一种新的索引,它可......
本文分析了评价搜索引擎中索引机制优劣的几个指标,针对XML文档的特点,设计了一个索引模块,给出了一种倒排索引方法。......
随着语义网络中数据量的激增,在RDF数据集中高效查询数据已成为一个亟待解决的问题。传统的基于物化视图的RDF模式匹配方法虽然能......
针对XML文件的特点,提出一种对XML文件建立索引的方法.该方法所采用的数据结构和算法,在充分利用XML文件的标记所隐含的上下文信息......
介绍了全文检索的概念及其中的数据预处理技术。结合安徽日报社新闻稿件采编系统和历史资料库系统实际情况,给出了一个新闻全文检......
路径表达式查询是XML数据查询处理的核心研究问题之一,研究者开展了大量的研究工作。但这些研究更多关注XML数据上路径表达式的匹......
无线环境的特殊性导致传统的关键字检索方法不能很好地用于周期数据广播之中。倒排表是全文检索中广泛使用的一种索引技术,但倒排......
搜索引擎在对网络资源进行适时定位时,往往疏漏同义词而导致所要信息的遗漏,这些问题引起了智能搜索引擎支持同义词查询的相关研究......
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足......
针对通用数据库海量数据检索速度慢的缺点,文章提出了一个数据检索优化系统。该系统通过将海量数据拆分成短语和单词,利用哈稀算法......
对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2L......
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前......
通过设计一个藏文图书查询系统,并给出该系统的总体结构图,对基于XML的搜索引擎中涉及的关键技术进行了研究,提出对XML这种半结构......
为提高XML文档的查询效率,提出一种基于倒排表与B+树的联合索引技术。DTD结构索引和内容索引采用倒排表作为索引单位,XML文档索引使......
随着信息技术的迅猛发展,数码产品的普及和因特网的深入人心。借助于计算机技术、网络技术和多媒体技术等,人们可以更加便捷地采集......
随着计算机技术和应用不断发展,人类面临着海量的数据。如何更好的利用好这些数据,以及怎么从这些数据中提取和挖掘出其中隐含的知......
如今XML数据被广泛应用于不同领域,其数据和文档规模不断增大,数目不断增多,导致网络中出现了大量的具有复杂结构的XML数据。如何......
随着Internet的不断发展,网络信息也成指数级的不断膨胀,这给信息检索带来了很大的困难,重复网页排除的研究工作是十分有意义的。......
随着Web2.0与云计算的兴起,越来越多的企业选择NoSQL作为企业应用的基本架构。作为非关系型数据库的典型代表,mongodb被更多的选择,用......
针对推断网络(NBI)的二分图方法中只是考虑用户是否评价过项目,却没有利用用户评分高低这一局限性,提出基于偏好的推断网络(PNBI)推荐......