互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

特色数据库建设中的元数据质量控制研究


[摘要]从特色数据库建设对元数据质量的需求出发,将其中的元数据质量问题总结为元数据错误、元数据遗漏和元数据冗余三类问题,从元数据制作过程出发思考产生这三类元数据问题的原因,并从需求分析和数据库设计、元数据标注和元数据审核校验三个阶段提出元数据质量控制的具体措施。
  [关键词]特色数据库 元数据 质量控制
  [分类号]G250.1
  
  元数据是用来描述数据本身内容和其他特征的数据,在数据库建设中,主要承担着描述信息、定位数据、检索资源、评估资源等重要作用,元数据质量直接关系到数据库的建设质量和服务效果。国外专门讨论元数据质量的研究大约始于2004年,美国学者Bruce和Hillman将其定义为“元数据满足需求和目标的程度”。特色数据库是根据各馆的馆藏特色或地方特色,集中搜集各种类型文献建立的数据库。作为数字图书馆建设的重要组成部分,特色数据库一直是各个图书馆建设的重点。据统计截至2007年底,CALLS在高校图书馆已建263个特色数据库,公共图书馆建了522个特色数据库,科学院系统建了32个特色数据库,这不包括非CALIS高校图书馆建设的特色数据库,如今特色数据库数量已远远高于这个统计数据。作为中小型高校图书馆,我馆已经构建或者正在建设的特色数据库就包括“黄河数据库”等近10个。由于特色数据库多由各馆负责或者参与构建,且涉及对象数据类型多样、种类繁多,再加上现有元数据规范体系的缺失等方面原因,特色数据库元数据的质量比商业数据库更值得关注。
  
  1 特色数据库元数据质量需求
  
  在特色数据库建设过程中,元数据承担着增加系统数据可信性、系统可用性以及资源发现能力等重要作用,是各方面功能、互操作以及参与聚合性服务等得以实现的关键。特色数据库对于元数据质量主要有如下4方面需求:
  1.1 资源组织方面的需求
  建立能够有效满足用户需求的高质量特色数据库,必须提取资源相关特征的元数据(题名、作者、关键词等),并科学地组织起来,便于资源的利用。特色数据库涉及的资源类型多样(图书、期刊、古籍、拓片、音视频等)、来源多样(开放获取资源、商业数据库、各馆自己数字化资源库等)、加工类型多样(目录、文摘、题录、全文等),特色数据库资源的复杂性使得其元数据质量控制具有很高的难度。因此,资源描述元数据尽可能选择合适的标准,涵盖所需的所有特征项,思考合适的资源描述粒度。同时元数据编制人员在描述资源元数据时还要保证资源在语义、语法和语义上的准确性。
  1.2 资源利用方面的需求
  特色数据库经过对相关资源特征抽取和标注以后最终的目的是提供给用户利用,这里的利用包括数据库查找、识别、挑选、获取和数据复用等。资源的检索、浏览和定位借助于资源组织时抽取和标注的特征元数据实现,其对于元数据质量的要求就是涵盖全面、标注准确。数据复用则要求元数据应该从多个角度对同一资源进行描述,元数据质量方面的要求是元数据的准确性、描述项目的标准化且应有一定可拓展性。
  1.3 数据库管理方面的需求
  建成的特色数据库除满足用户利用方面的需求外,还要满足特色数据库管理者管理方面的需求,如数据库所有权、安全控制、数据库及数据库部分内容访问统计、数据库之间互操作,这都需要借助于相关元数据实现。互操作管理元数据要求在建设过程尽可能采用相关、适用面广的标准,其他管理方面元数据则要求根据需要在数据库设计时设置好相关元数据字段。
  1.4 数据库长期保存方面的需求
  数字资源长期保存问题是近年来业界非常关注的内容,但从长远发展来看,像我馆这样的中小型图书馆并不需要保存诸如施普林格、维普之类的大型商业数据库(应由国内少数大型图书情报机构承担保存任务),我们需要长期保存的就是自己创建和管理维护的特色数据库。因此,特色数据库建设过程中应考虑特色数据库的长期保存问题,应该根据需要保存与数字资源长期保存相关的元数据,如:背景信息、软件硬件环境、转换历史、转换工具、采用元数据标准等。
分享:
 

了解更多资讯,请关注“木兰百花园”
更多关于“特色数据库建设中的元数据质量控制研究”的相关文章
    分享:
     
    精彩图文
    关键字
    支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
    关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
    全刊杂志赏析网 2016