论文部分内容阅读
一、 引言
图书馆通过实现日常管理服务的自动化,提升了管理的水平和有效性,然而,这仍然无法满足分析过程的需要,例如,哪种书籍的需求量更大?人们最喜欢哪个出版社的书籍?哪种服务模式可以满足读者的需要?而与此同时,高校图书馆管理信息系统可能每天都会产生大量的对图书和读者的管理数据、借阅归还图书的数据以及其他各种数据,而其他部门也另行提供了参考信息和书籍管理信息给系统。由于学校中各种图书管理系统以及各部门不尽相同,将导致数据库平台和数据格式的不一致性,因此,如何整合这些异构数据库的数据,提供更好的服务给读者,并提供图书订购,管理和其他信息给管理者做决策支持,是提升图书馆管理效率的主要问题。这需要实现对数据的统一管理,深层次开发挖掘大量的数据资料,并提取这些数据信息的内在联系,目标是提供有效的决策制定支持给管理者,以及为读者提供更好的服务。
二、系统结构
在本文中,使用数据仓库,OLAP,数据挖掘和联机分析挖掘的组合,构建了一个基于数据仓库的图书馆决策支持系统。源系统是各种现有的日常事务处理应用程序系统,经过整合,分类和统一化后,这些事务处理系统的原始数据和外部数据源被提取到图书馆的数据仓库中。在数据仓库中,数据是面向主题的、集成的、稳定的,可随时间而改变的数据集,以支持决策制定过程中的管理和运作。在该系统中,这些主题数据库包括:藏书结构的查询主题数据库和图书资源使用情况的主题数据库,用户使用互联网或者OLAP客户端程序访问数据。
(一)数据源层
系统需要从图书馆的每种类型的信息源中获取数据报文(包括内部和外部的),内部数据源是指学校或学院图书馆管理系统的后台数据库,而外部数据包括各种信息源,以及在各种类型站点上的各种数据报文,还应该包括一些业务数据,以提供给分析需求。数据源是数据仓库的起源,提供图书馆决策支持系统的主要数据。
(二)数据仓库层
在从各种类型的信息源中获取了数据以后,系统对数据进行提取,净化、改造,并根据特定的规则进行装载,组合数据以面向公共数据视图,存储在数据仓库中,并对其进行管理维护,因此,这层包括数据获取,数据存储和数据管理。数据仓库存储的是元数据和进行决策分析时使用的必要数据。元数据是数据仓库的核心,是描述数据的数据,存储数据模型,数据结构,转换规则,控制信息等。
(三)数据分析和应用层
基于数据仓库,本层主要是由OLAP,数据挖掘和联机分析挖掘技术组成,使用各种类型的分析挖掘工具支持,决策者可以做出正确的决策。可直接使用挖掘的知识和信息,以支持决策制定的分析,同时,通过数据挖掘和OLAP获取的新知识也可以立即添加到系统的知识数据库中。在图书馆数据仓库中,有大量的数据,这必然包括一些潜在的规则和知识,它们很难通过传统的分析方法被发现,OLAP,数据挖掘和联机分析挖掘技术为解决这个问题提供了一种策略。例如,通过挖掘读者和书籍之间的关系和模式,我们可以了解某类读者和某类书籍之间的相互关联性,为订阅书籍提供决策制定支持。数据仓库的优势弥补了DSS的不足,使目前系统的数据库资源获得充分利用,从而使整个系统形成一个有机的整体。因此,基于数据仓库技术的决策支持系统增强了系统的集成。
三、实现系统的关键技术
(一)主题定义
主题是数据分类的一个标准,每个主题对应一个宏观分析域,任何事务都有一个非常重要的主题与其相关。每个主题区域和目标必须具有唯一的定义,在图书馆的数据仓库实施过程中,常用的主题包括书籍、期刊、读者和供应商,它们之间具有一定的关系。
(二)数据模型的建立
多维数据模型是数据仓库的基本数据结构。在多维数据模型中,一部分数据是数字测量值(如销售额、投资额、支出额等),它们是依赖于一组“维”,而所有“维”提供了全部测量值的上下文关系。例如销售额与城市、产品名称和销售的时间有关,这些相关的“维”惟一决定了销售额这个测量值。因此,多维数据视图就可以表示为在这样一些由不同层次的“维”构成的多维空间中存放的数字测量值。
(三)前端分析工具
前端分析工具主要包括决策支持系统的分析工具,OLAP工具,数据挖掘工具和联机分析挖掘工具。在线分析处理(OLAP)是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。
(四)前端应用程序的实现
构建图书馆数据仓库的主要目的是提供决策支持服务,用户的前端应用主要提供决策制定依据给图书流通、图书采购、图书拒绝、图书馆发展等。通过使用决策支持系统分析工具,OLAP工具,数据挖掘技术,我们可以发现一些规律性的知识和信息,并提出可行的解决方案。
(作者单位:河南省周口职业技术学院)
图书馆通过实现日常管理服务的自动化,提升了管理的水平和有效性,然而,这仍然无法满足分析过程的需要,例如,哪种书籍的需求量更大?人们最喜欢哪个出版社的书籍?哪种服务模式可以满足读者的需要?而与此同时,高校图书馆管理信息系统可能每天都会产生大量的对图书和读者的管理数据、借阅归还图书的数据以及其他各种数据,而其他部门也另行提供了参考信息和书籍管理信息给系统。由于学校中各种图书管理系统以及各部门不尽相同,将导致数据库平台和数据格式的不一致性,因此,如何整合这些异构数据库的数据,提供更好的服务给读者,并提供图书订购,管理和其他信息给管理者做决策支持,是提升图书馆管理效率的主要问题。这需要实现对数据的统一管理,深层次开发挖掘大量的数据资料,并提取这些数据信息的内在联系,目标是提供有效的决策制定支持给管理者,以及为读者提供更好的服务。
二、系统结构
在本文中,使用数据仓库,OLAP,数据挖掘和联机分析挖掘的组合,构建了一个基于数据仓库的图书馆决策支持系统。源系统是各种现有的日常事务处理应用程序系统,经过整合,分类和统一化后,这些事务处理系统的原始数据和外部数据源被提取到图书馆的数据仓库中。在数据仓库中,数据是面向主题的、集成的、稳定的,可随时间而改变的数据集,以支持决策制定过程中的管理和运作。在该系统中,这些主题数据库包括:藏书结构的查询主题数据库和图书资源使用情况的主题数据库,用户使用互联网或者OLAP客户端程序访问数据。
(一)数据源层
系统需要从图书馆的每种类型的信息源中获取数据报文(包括内部和外部的),内部数据源是指学校或学院图书馆管理系统的后台数据库,而外部数据包括各种信息源,以及在各种类型站点上的各种数据报文,还应该包括一些业务数据,以提供给分析需求。数据源是数据仓库的起源,提供图书馆决策支持系统的主要数据。
(二)数据仓库层
在从各种类型的信息源中获取了数据以后,系统对数据进行提取,净化、改造,并根据特定的规则进行装载,组合数据以面向公共数据视图,存储在数据仓库中,并对其进行管理维护,因此,这层包括数据获取,数据存储和数据管理。数据仓库存储的是元数据和进行决策分析时使用的必要数据。元数据是数据仓库的核心,是描述数据的数据,存储数据模型,数据结构,转换规则,控制信息等。
(三)数据分析和应用层
基于数据仓库,本层主要是由OLAP,数据挖掘和联机分析挖掘技术组成,使用各种类型的分析挖掘工具支持,决策者可以做出正确的决策。可直接使用挖掘的知识和信息,以支持决策制定的分析,同时,通过数据挖掘和OLAP获取的新知识也可以立即添加到系统的知识数据库中。在图书馆数据仓库中,有大量的数据,这必然包括一些潜在的规则和知识,它们很难通过传统的分析方法被发现,OLAP,数据挖掘和联机分析挖掘技术为解决这个问题提供了一种策略。例如,通过挖掘读者和书籍之间的关系和模式,我们可以了解某类读者和某类书籍之间的相互关联性,为订阅书籍提供决策制定支持。数据仓库的优势弥补了DSS的不足,使目前系统的数据库资源获得充分利用,从而使整个系统形成一个有机的整体。因此,基于数据仓库技术的决策支持系统增强了系统的集成。
三、实现系统的关键技术
(一)主题定义
主题是数据分类的一个标准,每个主题对应一个宏观分析域,任何事务都有一个非常重要的主题与其相关。每个主题区域和目标必须具有唯一的定义,在图书馆的数据仓库实施过程中,常用的主题包括书籍、期刊、读者和供应商,它们之间具有一定的关系。
(二)数据模型的建立
多维数据模型是数据仓库的基本数据结构。在多维数据模型中,一部分数据是数字测量值(如销售额、投资额、支出额等),它们是依赖于一组“维”,而所有“维”提供了全部测量值的上下文关系。例如销售额与城市、产品名称和销售的时间有关,这些相关的“维”惟一决定了销售额这个测量值。因此,多维数据视图就可以表示为在这样一些由不同层次的“维”构成的多维空间中存放的数字测量值。
(三)前端分析工具
前端分析工具主要包括决策支持系统的分析工具,OLAP工具,数据挖掘工具和联机分析挖掘工具。在线分析处理(OLAP)是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。
(四)前端应用程序的实现
构建图书馆数据仓库的主要目的是提供决策支持服务,用户的前端应用主要提供决策制定依据给图书流通、图书采购、图书拒绝、图书馆发展等。通过使用决策支持系统分析工具,OLAP工具,数据挖掘技术,我们可以发现一些规律性的知识和信息,并提出可行的解决方案。
(作者单位:河南省周口职业技术学院)