页面排序相关论文
近几年,大规模开放网络课程MOOC引发全球的关注和参与。自动答疑是MOOC平台中重要的辅助教学模式,采用问答系统实现自动答疑是目前研......
图书资源在世界范围内广泛分布,它们与人类的生活息息相关,书籍是社会进步和人类文明的标志之一,是促进社会政治、经济、文化发展必不......
Web结构挖掘是从WWW的组织结构、Web文档结构和链接关系中推导知识的过程。目前基于网络的组织结构和链接关系进行挖掘的算法主要......
当今世界,伴随着互联网技术的急速发展,网络信息的膨胀速度呈指数增长。各行各业的人们由于互联网而紧密联系在一起,信息共享越来......
现代互联网技术迅猛发展,在人们的日常生活和工作中网络的作用日益凸显,尤其随着企业、校园等局域网(LAN)内部信息量的增加,人们发现......
量子计算中一个很重要的研究热点是量子行走。连续时间量子行走和离散时间量子行走已经得到广泛研究。在计算机科学中,经典随机行......
知识库是一种结构化、易于操作、有组织的知识集群。针对Wikidata这一开放知识库的内容及结构,提出一种构建标签云的方法,对信息进......
pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜......
页面排序算法是搜索引擎的核心之一。通过分析传统PageRank算法可知该算法主要是依据页面之间的链接关系,容易出现偏重旧网页、主......
本研究以用户对农业信息搜索需求为研究背景,设计实现了1个中文农业信息垂直搜索引擎,该系统采用向量空间模型对农业主题进行识别,......
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输入关键词后能不能迅速查看到要查找的信息。系统的介......
传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题.针对PageRank算法存在的上述缺陷,提出......
经典的基于链接结构的PageRank算法,它主要是依据页面之间的链接关系进行排序,容易出现主题漂移、忽视专业站点、偏重旧网页等缺点。......
搜索引擎中用户查询和网页资源之间的相似度研究一直是页面排序的研究核心。利用 HowNet 对词语的语义层次架构模型,对用户的检索词......
超链接导向搜索(HITS)算法是比较经典的基于超链接的算法,但它忽视了链接页面的文本信息内容,没有区分链接的重要性,从而导致算法......
垂直搜索引擎是搜索引擎领域的行业化分工,根据地学信息领域的行业特征、整体需求及其工作流程,在Nutch开源搜索引擎平台上添加了"......
全文检索是现代信息检索技术的一个非常重要的分支,它既是处理非结构化数据的强大工具,也是现代搜索领域的核心技术之一。本文对全......
“链接工厂”欺骗(Link farm sparn)和重复链接严重地损坏了像HITS这样基于链接排序的算法性能。为了检测与抑制Web“链接工厂”欺骗......
Nutch是一个优秀的开放源代码的Web搜索引擎。虽然Nutch的页面排序方法比较合理,但是很多情况下仍然不能满足需要。分析开源搜索引......
针对经典的PageRank算法存在的偏重历史网页、主题漂移、平分网页链接权重等缺陷,引入了向量空间模型和信息论中的信息熵,提出一种......
传统PageRank算法仅仅通过网页链接结构来确定网页的PageRank值,这通常会导致主题漂移问题,即主题内容不相关的网页PageRank值较高......
从社会网络中发现重要节点是一个很有意义的研究问题,目前多数重要节点发现方法是基于不加权网络。由于在社会网络中,节点之间的关......
Web挖掘是知识时代人们对于从大量信息中获取知识的需要。对于搜索引擎来说,Web挖掘技术对第三代搜索引擎的发展起着重要的作用,同......
系统地分析了现有的页面排序算法,指出了它们各自的优势和存在的不足,并指出不闻算法在不同领域和场合所具有的优势。建立专业搜索引......