论文部分内容阅读
高校图书馆作为知识来源的重要渠道之一,已经成为学生在学习生活中解决问题、获取知识的重要场所。然而随着图书馆藏书量的爆炸性增长,学生在其中找到最符合自己需求的书籍已经越来越困难。为了更好的服务学生,帮助他们快速、高效的找到自己需要的书籍,图书馆必须对自己的馆藏以及学生的借阅习惯都有很好的了解,调整自己的采购策略并开始建立具有较高精确度的图书推荐系统。为了解决上面的问题,本文提出了一个解决问题的思路,即运用数据挖掘中的关联规则挖掘对图书馆的借阅数据进行多维度、多层次的分析,并书得到的结论指导图书馆的图书采购决策以及图书推荐服务。本文首先阐述了数据挖掘的理论基础、图书馆用户分析的国内外概况以及性别分析的国内外概况。正文部分针对指导采购决策和建立图书推荐系统的需要,对具体借阅数据进行了多个维度、多个层次的具体分析。正文的第一部分分析了图书类别之间的关联规则,即分析哪些类别的图书经常一同被借阅。具体的分析层次包括:对全体学生进行挖掘;对全体学生按性别分类挖掘;将全体学生按专业分类进行挖掘;对每一专业再按性别分类进行挖掘。如此通过对每个层次得到的关联规则的分析,以及不同层次得到关联规则的对比分析,可以得到全体同学都经常借阅的书籍,不同专业、不同性别的同学经常借阅的书籍,这些关联规则可以用来指导采购决策。而表达有关专业与书籍之间、书籍于书籍之间关系的关联规则则可以直接作为推送规则,以此为基础建立推送模型,指导图书推荐系统的建立。文章的第二部分探讨了图书与其他属性之间的关联规则。分析学生的其他因素与所借图书之间的关系,这些关联规则可以指导图书馆建立更加准确、更有针对性的图书推荐系统。包括:一,分析了图书的借阅周期与图书类别之间的联系;二,分分析了不同学习成绩的同学与所借阅的图书之间的联系。其中第二部分先对借阅数据按年级分类,然后再展开挖掘,由此可以得出不同成绩的同学在不同年级借阅书籍趋势的变化。借阅周期和学习成绩这两个因素可以从该专业经常节约的图书类别中筛选出对于高质量的、更适合该专业学生的书籍进行推送。通过对上述两个部分得到的关联规则进行分析,图书馆可以得到能够指导自己图书采购决策和图书推荐的有价值的信息。