一种抵抗链接作弊的PageRank改进算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:abcwangyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量的基于链接的搜索引擎作弊方法对传统PageRank算法造成了巨大的影响,例如,链接农场、交换链接、黄金链、财富链等使得网页的PageRank值失去了公正性和权威性。该文在分析多种作弊方法对传统PageR—ank算法所造成的不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法-TSPageRank算法,该文对TSPageRank算法的原理进行了详细分析,并通过实验证明TSPageRank算法比传统的PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank
其他文献
  该文基于朴素贝叶斯分类器时朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法时朝鲜语文本进行特征选择,并使用类TF—IDF估算方法计算权重;其次,构
期刊
目的:确立《黄帝内经》脾藏象理论相关术语的语义类型,为中医药语义类型研究提供思路与方法。方法:基于中医术语学研究方法,依托中医基础理论,经文献梳理、提取、规范、分类
平行语料库是对机器翻译、跨语言信息检索等应用技术具有重要支撑作用的基础数据资源。虽然互联网上的平行网页数量巨大且持续增长,但由于平行网站的异构性和复杂性,如何快速自
共轨接力移行机是指在同一个移行轨道内包含2个或多个移行机,在移行的某一个或几个位置增加载体举升装置,此位置作为其中的2个移行机的共用位置,一个移行机移到此位置,举升装
目前网页标题的抽取方法大多结合HTML结构和标签特征进行抽取,但是这些方法并没有考虑标题与正文信息之间内容上的联系。该文提出一种基于相似度的网页标题抽取方法,该方法利