论文部分内容阅读
将智能Agent应用于数字图书馆信息采集与服务系统,以提高它的个性化服务水平是主要目的。在深入分析当今数字图书馆中个性化信息服务技术和研究应用现状,以及了解和介绍Agent、搜索引擎和web信息采集等相关技术的基础上,把智能Agent技术应用于图书馆信息管理系统上,在高校数字图书馆中提出了一个基于Agent的智能信息采集与服务系统模型,围绕该模型的构建和软件实现,主要工作有: 首先,对现有的图书馆信息管理系统进行分析,详细了解它的系统功能和应用功能。为下一步工作做准备。 其次,构造了一个多Agent系统(MAS),各子系统既相互联系又相互独立,可以就每一子系统涉及的技术分别加以研究。此MAS工作于一个现有的图书馆信息管理系统基础之上,MAS通过一个接口将用户的检索要求转化为现有系统能够执行的检索条件并进行检索;另外,它将查询来的结果按照系统学习的用户个性化特征过滤后推送给用户。系统按照用户兴趣查全和查准信息,这种能力取决于用户Agent对用户兴趣的学习和储存于用户模型库中用户兴趣信息的完备和准确程度,而用户特征信息的完备性和准确性随着系统学习用户兴趣的积累和深入而不断提高。 再次,在该系统模型中同时表达了文档、领域和用户三种信息描述模型。文档是信息处理的对象,文档模型的建立是特征提取、文档过滤等智能信息处理的基础;利用主题概念及其关键词表达领域模型,使得信息服务突出了面向领域的特征,可以更好地实现信息服务的个性化、智能化;用户模型则体现用户的兴趣和意图,用于用户兴趣的表达和挖掘。 第四,由搜索、监测Agent根据领域模型搜索文档和信息。过滤Agent对所搜集到的网页进行分析,抽取文档特征,形成文档的结构化表示。在过滤Agent中提出了文档特征和新领域关键词的提取方法;推荐Agent通过比较结构化的文档属性与用户模型,寻找相似度最大的用户,并将其选择的文档推荐给用户。以及通过比较用户间的相似性,从而向相似用户推荐相应URL或其他文档。推荐Agent中描述了文档选择和相似用户间文档推荐策略。 最后,对所做的工作做出结论并提出今后工作的展望。