WEB结构挖掘相关论文
今天,人们寻找WWW上的信息,通常是在搜索引擎上执行一个查询。很多搜索引擎是基于关键词的,对于每一个查询,他们返回一个与查询内容匹......
企业在Portal上发布与企业相关的信息,使得浏览者迅速找到他所需要的内容。由于Internet的规模与使用的持续增长,大多数的Web结构非......
Web挖掘是传统的数据挖掘理论在Web中的应用,其涉及多学科领域的知识,如计算机网络、数学、人工智能等,是一个交叉性的研究领域。W......
SNS (Social Network Site),即社交网站。近几年,网络上掀起了一股社交网站的风潮,由于国内社交网站发展较晚,是借鉴外国Facebook......
学位
信息的网络化给广大用户带来方便的同时,由于其面向对象的广泛化,网络上存储的信息庞大而纷繁复杂,这样就给使用者获取有用信息带......
随着Internet的迅猛发展,Web成为了人们获取信息的重要途径。但是,网页数量的与日剧增,信息量的爆炸式增长,也为人们的信息查询带......
摘要: 随着互联网的迅猛发展,web上的信息飞速增长,如何从大量的数据集合中抽取有用的信息,找到有效的数据管理和使用的平台,合理的组织......
本文介绍了Web结构挖掘的基本概念,分析了HITS和PageRank算法,并对这两种算法进行了比较,最后探讨了基于这两种算法的改进算法.......
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网......
本文从Web数据挖掘的概念入手,介绍了Web挖掘的一般流程,重点阐述了Web挖掘任务的三种分类:Web内容挖掘、Web结构挖掘和Web使用挖......
Web的出现,将海量、异构、动态数据处理这样一个新的课题摆在人们的面前。Web数据挖掘是将数据挖掘技术和Web结合起来,本文主要从Web......
Web数据挖掘是目前数据挖掘领域中一个很重要的研究领域,文章首先介绍了Web数据挖掘的几个分类,分析了Web数据挖掘所面临的问题,最后......
随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。文章从Web结构挖掘的角度出发,在分析传统的HITS(Hyperlink—Induced T......
在分析Web结构挖掘现有算法的基础上,重点研究了HITS(Hyperlink-Induced Topic Search)算法.Hub页面的多主题性、无关页面和无关链......
在信息化时代,用户访问网站一般都带有针对性与目的性,电子商务网站可以通过对用户访问的数据进行分析,从而发现潜在的客户并且了......
摘要: 在研究Web结构挖掘经典算法Pagerank和云计算关键技术Mapreduce的基础上,将Pagerank算法与Mapreduce编程模型结合,针对基于并行......
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点。基于Web结构挖掘中HITS算法......
Web站点是由许多Web页面构成的信息系统,随着网络的飞速发展,Web挖掘得到了越来越多的研究。如何从Web中找到与用户查询主题相关的......
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确的主题爬虫显得......
针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构......
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记......
当前网络发展迅速,各种网站比比皆是,它容纳了海量的信息,但是这么多的信息,却使人们产生了信息贫乏的感觉,这是因为Web上的信息覆盖面......
分析了Google的PageRank(PR值)算法原理,详细论述了网站链接的3个主要方面:出站链接、入站链接、站内链接的变化对网站PR值的影响,并......
博客(Blog)网站作为近年来新型的网络媒体得到越来越多的个人和企业的关注,因此针对Blog数据设计了相应的数据分析系统.并介绍了Blog数......
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖......
随着Intemet/Web技术的快速普及和迅猛发展,各种信息可以以非常低的成本在网络上获得。如何在这些信息中找到用户真正需要的内容,成为......
在调研近十余年国内外链接分析研究的相关文献的基础上,归纳了链接分析研究的四大视角,即网络计量学视角、检索优化视角、Web结构挖......
社区的存在是互联网的一个重要特性;结合链接分析和社区发现的知识,提出了一种搜索引擎结果排序算法,通过与相同主题下PageRank算法的......
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为研究的热点。基于Web结构挖掘的PageRank算法存......
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘....
在对web结构挖掘的典型算法探讨的基础上,提出了一种PageRsnk算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。......
[摘 要]HITS算法是基于链接分析的一种权威资源提取算法。相对于其他Web结构挖掘算法来说,HITS算法优势非常明显。针对HITS算法的缺......
该文从Web结构挖掘角度出发,利用概率论分析了Web结构挖掘的PageRank算法,得出挖掘结果,最后介绍Dijkstra算法在其挖掘结果的应用。......
Web上的信息以及用户都在以接近于指数的速度增长,到2001年9月Web服务器已接近3000万台,网络用户数量接近4亿[1].......
简要分析了PageRank的思想及其优缺点。基于信息时效性特征,对Web资源的几类典型的时效曲线变化规律进行了研究。采用分段曲线拟合......
Web挖掘能从大量非结构化、异构的Web信息资源中发现有用的知识或者模式,它已经被广泛地应用于许多不同的领域。目前,Web挖掘在教育......
对HITS(Hyperlink-Induced Topic Search)算法进行研究,克服其主体漂移和扩大化等缺点,改进并提出建立一个新的基于链接分析的Web......
摘要:随着大型数据库的不断涌现,不缺数据缺知识的矛盾日益突出。大量web信息中获取有用的信息是web数据挖掘的关键问题。该文重点探......
在分析总结两种主题爬虫设计的基础之上,研究了用链接分析改进主题爬虫的方法。通 过实验,比较引入链接分析前后的结果,论证了其......
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术......
Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的必然结果。讨论Web数据挖掘技术中各种类型的Web数据挖......
信息技术的发展催生了更多更先进的数据挖掘技术,其中基于Web结构的数据挖掘技术获得业界普遍关注。文章从Web结构挖掘深入研究运......
论述了Web上的数据挖掘技术并作了分析和比较,对Web数据挖掘技术的应用也作了分析和展望....
互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识.Web挖掘的应用为解决此问题指明了方向.该文从Web内容挖掘......
从Web结构挖掘的角度出发,比较了基于链接结构分析的PageRank和HITS2个经典算法,针对HITS单纯利用链接,忽略主题相关性问题,利用模糊关......
数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用.本文分析了Web挖掘的过程模型,对基于数据挖掘的Web挖掘......
教育信息检索是教育信息应用于教育科研与教育教学的页面之间的链接结构进行挖掘.本文对Web链接结构挖掘在教育信息检索方面上进行......