论文部分内容阅读
数字图书馆已经成为当今图书馆发展的方向。随着数字图书馆的发展,数据仓库技术、数据挖掘技术面临着广阔的应用前景,但由于目前国内对数据仓库、数据挖掘技术在图书馆领域的应用研究落后,图书馆的许多优势未能得到体现。关联规则分析是数据挖掘的一个非常重要的研究分支,其主要的研究目的是从大型数据集中发现隐藏的、有趣的、属性间存在的规律。本文在对数据挖掘相关技术、关联规则挖掘算法进行深入研究的基础上,探讨了如何提高Apriori算法的有效性,并对Apriori算法的缺陷,尝试用自适应步长跃进、动态修剪候选项集进行改进,提出了一种改进的Apriori算法。然后,以湖南工程职业技术学院图书管理系统为例,介绍高校图书管理系统的系统结构、业务流程;并研究基于这个数据库建立数据仓库的方法。通过对读者数据的集成和综合,较为全面地对读者行为进行评估和分析,进而改进和提供相对应的服务。图书馆借阅记录是读者使用图书馆资源的最佳证据,也是读者满足个人信息需要的行为结果,这类信息往往能反映使用者实际的信息需求,因此对于掌握读者兴趣,进而加强图书馆资源利用具有一定的参考价值。由于借阅记录蕴含大量读者与图书馆互动的历史记录,若能利用数据挖掘的技术从中挖掘隐藏有意义的信息,不仅有利于读者信息需求的了解,还可以图书管理员购书提供服务信息,有利于合理配置图书馆的文献资源和提高资源的利用率。最后,根据前面章节的研究成果,利用关联规则挖掘算法实现了对图书馆借阅记录的信息挖掘,挖掘出借阅爱好关联性、异类图书资料被同时查阅的关联性、院系之间查阅资料的关联性等,得到一些对图书管理者、决策者有价值的信息,促进图书管理形成一个良性循环。数据挖掘技术在数字图书馆构建中的应用尚处于起步阶段,本文在数据仓库构建等方面的方法还有待改进,主要意义在于探讨如何把数据挖掘技术应用到图书管理系统中,为提高管理水平和效率服务,并希望能对本领域相关学者的研究工作起到参考和促进作用。