互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

基于数据仓库的高校图书馆管理的设计与实现


□ 刘 晶

  [摘要]目前高校图书馆管理过程中产生大量的数据,而应用数据仓库技术可以从中获得重要的决策信息。剖析高校图书馆管理系统的现状和存在的问题,设计实现一个数据仓库系统,包括事实表、维度表以及以借阅事实表为中心的数据仓库模型。指出利用OLAP技术进行数据分析,以期为图书馆和高校提供决策支持。
  [关键词]高校图书馆 图书馆管理 数据仓库 数据分析
  [分类号]G258
  
  目前我国高校图书馆管理已经从手工操作转变为联机事务处理,在为读者和图书馆管理人员带来方便的同时也产生了大量的数据,但是从零散的数据中很难看出包含的潜在信息。将数据挖掘技术应用于图书馆管理系统,可以把产生的大量原始数据转化为有价值的知识,为管理人员提供决策支持信息。而进行数据挖掘的第一步即建立数据仓库。本文在剖析高校图书馆管理系统的现状和存在问题的基础上,设计实现了一个数据仓库系统,以期为图书馆和高校提供决策支持。
  
  1 高校图书馆管理数据仓库系统(ULM-DW)总体结构
  
  创建数据仓库的工作是在原有的数据库基础上进行的,因此要分析原有的数据库系统中所有数据,在原有系统基础上建立新的数据仓库,再选定主题,进行统计分析和数据挖掘。本文的数据仓库采用“数据驱动”的方法进行设计,其总体设计架构,见图1。
  
  数据仓库的主要数据来源于原有的图书馆管理系统、汇文系统、数字图书馆统计系统等,这些数据存放在两种类型的数据库中:SOL Service和Oracle。首先从原始数据库中提取相关数据,然后进行清洗和转换,进入到数据仓库中存储,数据仓库中的数据是各个系统的原始数据,如:读者借阅记录、购书记录等,没有经过任何级别的汇总,保证了数据仓库的最小粒度数据,有利于数据挖掘的应用。在数据仓库的基础上,分别进行数据分析,并展示给相关授权者使用,以辅助决策。
  
  2 数据仓库的设计
  
  数据仓库建立的过程实际上是从传统的以数据为中心的操作性系统结构转移到以数据仓库为中心的体系结构的过程。数据仓库设计的主要工作是业务流程结构设计、主题设计、粒度设计。下面以图书借阅为例,详细描述这些步骤。
  2.1ULMDW业务建模
  先以图书借阅为主题,进行业务流程分析,在分析已有数据库表结构的基础上,说明表之间的关系,从而为数据仓库的实现打下基础。图书馆图书借阅流程,如图2所示:
  
  2.2ULMDW主题设计
  主题设计是数据仓库的关键,针对高校图书馆管理的需求特点,提出读者、图书和图书借阅三个主题。其中以图书借阅为核心的主题设计,通过对图书借阅数据的分析,可以得到相应主题的分析结果,这些数据信息有助于做出决策。而读者和图书主题是进行辅助分析决策的相关主题,这些主题也反映了高校图书馆现行发展阶段中所关注的一些方面。
  
  2.3粒度设计
  在粒度设计中,应优先考虑为业务处理获取最原子型的信息而开发维度模型。为了查询能以最精确的方式对细节知识进行抽取,数据仓库往往要求在每个维度可能得到的最低粒度上对数据进行表示。通过上述分析该系统中的粒度都选取最底层的,这样便于决策者不断的向下观察细节数据。
  在ULMDW的业务数据库中收集的数据是最小粒度,如时间包含年、月、日、时、分,用户对数据颗粒度的要求的变化会影响到数据模型的设计。在本系统中最佳粒度的数据是图书借阅事务的单个分列项,为了确保得到最大限度的维度性和灵活性,所有讨论都将在这个粒度上展开。
  
  3 数据仓库系统实现
  
  ULMDW在设计时采用星型模型来表示多维概念模型,该模型包括事实表,事实表的每一个维度都有一个维表。事实表的每一个元组都包含有指向各个维表的外键和一些相应的测量数据。在实际的设计中,图书馆根据读者主题、图书借阅主题和图书主题的需要,建立事实表和维度表。然后,从各数据源中抽取数据,集成到数据仓库中。
  
分享:
 
分享:
 
精彩图文
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
全刊杂志赏析网 2015