互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

数字图书馆知识组织系统热点分析


□ 黄 微 陈 玲 范 轶

  [摘要]数字图书馆知识组织系统的构建有赖于本体的开发与完善,从解决数字图书馆知识组织系统语义丰富度视角,对当前学界对该领域热点问题的研究状况进行分析,包括:本体构建与复用,本体整合、语义分析与抽取、语义标注以及语义互联应用。
  [关键词]数字图书馆 知识组织系统 领域本体
  [分类号]G250.76
  
  1 引言
  
  数字图书馆(DL)是信息环境网络化、数字化、知识化的产物,是国家信息基础设施的核心。数字图书馆把知识作为工作对象,并且关注知识的应用环境和应用群体,因此,知识组织系统的构建在数字图书馆建设中始终发挥着核心的作用。
  从广义理解,数字图书馆知识组织应包括数字资源的知识组织系统的构建、语义自丰富、语义互联、互操作、术语服务等。
  
  近年来,在我国图书情报界,本体研究成为了数字图书馆知识组织系统构建的一个热点研究领域。目前为解决数字图书馆知识组织系统语义丰富度问题,本体构建与复用、本体整合、语义分析与抽取、语义标注以及语义互联应用成为学界研究的热点和建设的重点(见图1)。
  
  2 研究现状与热点
  
  2.1本体建模与复用研究
  本体建模方法的研究对于本体的应用有至关重要的作用。数字图书馆知识组织系统的构建有赖于本体的开发与完善,本体的开发和完善是一个反复叠加的过程,不会一蹴而就。目前国内外学者试图从本体建模方法和开源本体的复用两个方面进行突破。
  目前本体建模的研究已经进入实际应用阶段。许多研究领域都建立了自己标准的本体,但由于领域本体建设还没有成熟的方法论作为指导,目前提出的本体建模方法都是面向特定领域或针对具体的项目,而且都不是经权威标准化机构认证的方法,这就导致各种本体建模方法的出现。如骨架法、企业建模法、循环获取法和IDEF-5方法等。
  本体复用已成为重要的课题,越来越多的应用利用本体表示语义信息,因而如何支持本体复用变得愈加重要。本体复用主要有三种:①简单地把整个源本体导入目标本体Wppl,且仅用其中部分规则,而直接忽略其余规则;②仅“复制+粘贴”源本体规则的某子集到目标本体Wppl为导人规则的子集;③把源本体分解成不同的模块,根据相关标准,仅导入需要的模块。相比而言,第3种方法是最有发展前景的方法,目前的困难在于本体的模块化还不很成熟,只提供了本体类的理论和算法。
  W3C标准定义的OWL本体语言由一系列规则组成,包括类规则、属性规则和实例规则。在如下导入相似性标注的帮助下,OWL本体可以导入其他的OWL本体:
  Annotation(ireports)
  Annotation(imports)
  导入标注含有把两个源本体导入目标本体的规则。把本体概念加以扩充,可以实现从源本体的类、属性和实例的语义导入。本体复用需要评价已有本体与目标本体之间的关联性。共享和复用是本体的本质要求,也是领域本体建设中很重要的问题。
  
  2.2本体整合
  本体整合是本体的语义和解释范畴的问题。本体整合最初由SWAP(Semantic Web and Peer to peer)项目和SEKT(Semantically Enabled Knowledge Technolo—gies)提出,利用本体整合处理本体异质(ontology heterogeneity)。Paolo Bouquet等人给出了本体异质的详细分析,指出在分布式和开放式系统中本体异质是不可避免的,并根据本体异质产生的原因将其划分为4个层次:表示层、术语层、概念层和语义层。Paolo Bouquet等人还认为:表示层的异质可以通过翻译成统一的本体表示语言来解决;术语层的异质通过词汇映射来解决;概念层异质的解决需要通过对整个本体进行考虑,查找不一致,进行映射或合并;语义层的异质可能存在着表示层、术语层、概念层异质,还可能存在语义关系上异质,目前还没有很好的解决方法。
  本体映射是本体整合的一个关键环节,它通过一定的方法在已存在的不同本体间建立映射,以便在已存在的和新的领域之间进行交流时有通用的接口和共同的理解。在现实应用中,领域本体规模都很庞大,利用手工方式,进行本体概念比对完成本体映射时繁琐且易错,因此是不可行的。目前国内外研究者对自动化本体映射的方法和技术进行了深入研究,其主要特性如表1所示:
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
全刊杂志赏析网 2016