论文部分内容阅读
随着计算机技术、通信技术的日臻成熟和广泛应用,互联网自90年代初开始得到迅猛发展,互联网上信息资源越来越丰富.但是在浩如烟海的互联网信息世界中,人们寻找有用信息存在着很大的困难,究其原因,一是用户信息需求的特定性、有限性和互异性与信息资源分布的无限分散性之间存在矛盾;二是现有搜索引擎的缺陷与信息服务需求之间不相适应.比较好的解决方法就是寻求一种更加优秀的信息服务方式,使其更好地满足用户的需要,于是,便产生了目前所倡导的个性化信息服务.该论文围绕Web个性化信息服务,针对其相关的关键技术展开研究,主要完成了如下工作:1、提出了一个基于Agent的集成搜索引擎系统结构模型,并就该模型讨论了其结构、功能划分以及设计与实现中的关键技术,进而针对成员搜索引擎选择这一集成搜索引擎的关键技术问题,将个性化信息服务的概念引入到成员搜索引擎选择中,提出了一种基于用户个人喜好的成员搜索引擎选择策略,并就该策略进行了详细讨论.2、针对学习用户问题,在讨论了WAIR和Webwatcher等现有的采用强化学习方法进行用户兴趣学习方法的基础上,采用强化学习中的时间差分法来完成对用户的学习,在文献[57]给出的个性化信息过滤算法基础上提出了一种强化学习用户的算法,并同Young-Woo Seo所提出的算法进行了比较,分析结果表明该文提出的算法更为有效.3、Web数据挖掘技术是数据挖掘技术应用在Web上发展起来的.用它获取用户兴趣知识和信息源知识,是实现个性化信息服务的有效手段.该文在探讨基于Web数据挖掘技术的个性化信息服务系统模型的基础上,针对Web数据挖掘的分类算法开展研究,对C4.5算法进行改进,提出了一种检测类阈值构造决策树的算法,经实验并与C4.5算法比较,表明该算法性能有所改善.4、随着Web应用的日益广泛和深入,XML文档势必取代HTML文档而成为Web文档的主流.于是,针对XML文档的检索技术已成为计算机网络领域的研究热点之一.该文将XPath语言与传统的向量空间模型相结合,提出了一种基于简单XPath路径的向量检索算法来实现对XML文档的检索.