互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

叙词表微观结构的描述与评价


□ 吴雯娜 曾建勋

  [摘要]就EI叙词表与我国47部叙词表的微观结构进行对比,提出从概念深度、概念分化度、概念聚合度、概念横向关联度四个方面来描述和评价词表纵深结构和横向关联结构的方法。通过分析,发现EI叙词表概念体系纵深大、分化度高、聚合度高、横向关联点多、入口率高,在结构上更合理。据此对比分析结果,指出我国叙词表在微观结构上存在的问题以及在新的技术环境下编制叙词表的建议。
  [关键词]EI叙词表叙词表编制叙词表微观结构叙词表评价词间关系描述
  [分类号]G254.24
   在不同的上下文中,叙词表可能表达不同的含义:一些情况下等同于“叙词法”,指的是一种知识表示机制,即知识:概念+概念间关系(一般为三种),其中概念表示知识世界中的事物,概念间关系表示事物间广泛存在的关联;另一些情况下,叙词表是指特定学科领域的概念和概念间关系的集合,是对文献信息进行主题标引和检索的工具。  叙词表具备如下作用:①提供一种知识结构,用来揭示概念之间的关系,帮助使用者理解知识领域的结构;②提供一种词汇控制工具,指导标引者和用户使用一致的词进行标引和检索;③提供一种术语参照系统,使得用户可以通过它扩大或缩小查找范围;④提供一种动态的词汇集合,使得任何新的概念可以以用户能够理解的方式纳入词汇系统中的相应位置。
  
  随着计算机在图书情报领域的广泛应用以及叙词表编制技术的逐步成熟,在世界范围内产生了数以千计的叙词表,覆盖了各学科领域。当前,叙词表编制和使用的主要特征是国际上一些比较权威的叙词表在使用中得到了持续的维护和更新,基本适应信息时代的发展;而我国叙词表的编制和使用在经历了上世纪80年代的大发展后,目前的总体情况是趋于停滞。原因可能是多方面的,从技术层面上看,以下方面可能是主要原因:①叙词表辅助应用工具开发相对滞后,叙词表应用成本较高;②绝大部分叙词表独立于信息检索系统,没有与信息检索系统的发展同步,未能形成良性互动;③叙词表质量良莠不齐,在内容上、结构上和显示方式上存在缺陷,导致综合应用性能较差。
  
  近几年来,为了弥补全文检索系统在处理自然语言文本时由于词汇歧义带来查全率与查准率低下的问题,词汇控制技术重新得到关注和应用。叙词表相对完善的词汇控制体系和已有的词汇集合为这一改进提供了可能性。但大发展于20世纪80年代的叙词表是否能适应数字化、网络化背景下的词汇控制是需要具体分析研究的问题。本文选择具有较好应用基础的EI叙词表与我国47部叙词表进行了对比研究,针对叙词表微观结构进行剖析,分析词表微观结构与应用性能的关系,试图为新技术环境下词表结构体系的优化提供依据。
  
  1、叙词表与我国叙词表介绍
  
  EI叙词表主要用于EI Compendex数据库(Engi-neefing Information’s Compendex Database,印刷版称EIIndex)文献的标引及检索,由Elsevier Engineering Infor-mation公司编制出版,EI的前身是工程标题表(Subject Heading for Engineering),简称SHE。SHE包括二级标题词:主标题词(heading)和副标题词(subheading)。1990年后,SHE发展为EI词表(EI Vocabulary),收录12 000个术语,增加了分类表(Index to ClassificationCode)。从1992年开始,EI Vocabulary又发展为第一版的EI叙词表(EI Thesaurus)。此后,EI叙词表不断修订完善,1995年第二版,1998年第三版,2001年第四版,2006年修订到第五版。目前EI叙词表的基本信息是:总收词量19 296,叙词9 926,非叙词9 370,族首词85,有5级分类,英文语种。
  叙词表在我国的大规模编制始于20世纪80年代。从20世纪80年代中期到90年代中期约10年的时间,是叙词表编制出版的高峰期,大部分叙词表是在这一时期编制的。到目前为止,我国编制出版的叙词表有120多部(不包含各类公文主题词表),基本覆盖了各学科领域。目前虽然有少量的叙词表仍保持着使用和维护,但总体情况不容乐观,大多数叙词表处于维护困难、发展停顿的状态。
  
  2、叙词表的微观结构及其描述
  
  2.1叙词表的微观结构
  叙词表是叙词的总汇,但叙词表不是叙词的任意堆砌和汇集,而是一个严密、完整的有机体。叙词表的结构可以从宏观(整体结构)和微观(单元结构)两方面来进行描述。叙词款且是组成叙词表的“细胞”,因此叙词款目被称为叙词表的微观结构。对叙词款目的描述一般包括几个内容:款目词项、标记项、注释项和参照项。参照项用以描述款目词与叙词表中其他词汇间的相互参照关系,叙词表中包括三种类型的参照关系:等同关系(即用代关系)、等级关系(即属分关系)、相关关系(即参关系)。本文主要讨论由词及词间关系形成的叙词表微观结构的描述和评价方法。
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
全刊杂志赏析网 2016