论文部分内容阅读
随着计算机技术和信息技术的发展和普及,自动化管理技术被广泛的应用到高校图书馆的管理中,传统的图书馆模式逐渐向数字图书馆转变。数字图书馆具有信息量大、易存储、使用便捷和突破时空限制等特点,因此更加吸引图书馆人的眼球。也正是由于数字资源信息量巨大,读者很难从形式多样的海量信息中发现自己需要的资源信息,读者为了获取有价值的信息资源已经造成了时间和精力上的严重浪费。因此,在数字图书馆时代,选择难成了读者阅读文献资源的主要障碍。笔者通过对国内的高校图书馆使用的自动化管理系统进行调查后发现,目前的图书管理系统仅作为事务管理和信息检索,是无法发现数据中存在的关系和规则,无法根据现有的数据预测读者的个性化需求。将关联规则的挖掘方法应用到图书流通数据的分析,挖掘和发现读者借阅行为中隐含的规律,为读者提供智能化的图书推荐服务,是十分值得我们研究的问题。关联规则是从大量数据中挖掘出有价值的数据之间的相关关系,它反映一个事物与其他事物之间的相互依存性和关联关系,如果两个事物或多个事物之间存在一定的关联关系,那么其中一个事物就能通过其他事物预测到。由于经典关联规则方法和与之相对应的算法中存在很多问题,导致它在实际应用中受到限制。经典关联规则方法存在很多的缺陷和不足,经典关联规则方法的相关定义来源于超市购物的知识发现,所以它仅能适用于超市购物或是与之相似的领域。对于其他应用领域,频繁项目集定义存在严重缺陷,如果应用该定义所生成的频繁项目集很容易受到干扰,产生一些无效的规则。经典关联规则生成算法的时间复杂度太高,而处理海量信息需要高效算法,二者存在矛盾。本课题的目的是通过对数据挖掘中关联规则相关理论的学习研究,将关联规则挖掘技术引入到高校图书馆的读者服务中,研究在图书馆的集成管理系统的基础上实现图书的智能查询算法。在具体的实现研究中,根据关联规则所存在的缺点,建立基于关联规则的图书馆图书智能查询系统必须给出与经典关联规则方法等价的相关定义,提出完备的频繁项目集定义,定义高效的关联规则生成算法。以某高校图书馆的借阅历史记录为测试数据,应用关联规则技术进行数据挖掘,通过对借阅数据的挖掘结果进行分析,找出具有强关联的图书,根据读者的查询信息,能够向该读者推荐与查询信息相关的参考图书,实现图书的智能查询和个性化推荐服务。