互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

基于本体的知识检索模型及呈现技术研究


□ 王兰成 曾 琼

  [摘要]论述知识检索是传统信息检索的发展,基于本体的知识检索模型和知识检索呈现技术,是当前知识检索研究中的关键问题。介绍知识检索的研究和发展,对知识检索模型进行研究,提出基于本体的知识检索模型;研究知识检索结果的呈现技术,探讨知识组织体系及本体的语义标注问题,提出基于本体的知识检索呈现方法。
  [关键词]知识检索 检索模型 呈现技术 本体
  [分类号]G250.73
  
  知识检索的产生与发展一方面来源于用户对知识检索的需求;另一方面来源于信息检索理论与实践的发展与完善。知识检索模型和知识检索呈现方法是知识检索的重要研究方面,以本体作为知识组织的方法,能实现基于语义的知识检索。
  
  1 知识检索技术的研究与发展
  
  在W3CHINA.ORG讨论区中呈现了如下的关于知识检索的介绍:①知识检索的基本思想就是模拟扩展人类关于知识处理与利用的智能行为和认识思维方法;②知识检索通过挖掘其深层含义,充分精确地表达知识资源和用户需求,进而在各类异构的数据库、数据仓库、知识库中进行检索,返回最相关的结果的检索机制;③基于Ontology的知识检索可以阐述为:在领域专家帮助下建立领域Ontology,把收集来的数据按规定格式存储在关系数据库、知识库等的元数据库中;④查询转换器按照Ontology把查询请求转换成规定的格式,从元数据库中匹配出符合条件的数据集合,检索的结果经过定制处理后返回给用户;⑤知识检索的基本特征有:支持自然语言检索;支持语词、语义内容的处理,实现同义词扩展检索和关联检索;具有概念推理和学习功能;具有强大人机交互接口。
  知识检索是一种全新的信息检索方式,是在现有的信息检索技术以及模型上发展而来的。搜索引擎是当前检索信息的主要方式,它们能在短时间内反馈给用户大量的信息,但反馈信息中的信息噪音过大,其中包含了太多的无用信息;目录分类的数据库规模较小,以致某些主题下收录的范围不够全面,检索到的信息数量有限。可以看出,传统的信息检索缺点在于没有从语义层次上对信息进行标引,不能够满足用户在语义和知识上的需求。而知识检索是综合运用信息管理科学、人工智能、认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理与多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取文本、图像、视频、声音等媒体类型的知识源,并能准确精选用户需要的结果。知识检索是将信息或知识按照一定的方式组织、存储,并根据用户的需求找出相关信息和知识的过程。在这个过程中,被检索的对象是知识资源、知识库。知识检索就是采用一种从语义上标引文章的技术,形成知识库,再从知识库中查询用户所需的信息。
  知识检索和信息检索的不同,在于知识检索强调了语义,它从文章的语义、概念出发,能够揭示文章的内在含义,而不像信息检索只是基于字面的机械匹配。知识检索提高了查全率和查准率,减轻了用户的负担。表1从检索语言、检索模型、组织方式、搜索方式和检索效率方面进行了归纳。
  与主题词表或分类表不同的是,本体是领域知识规范的抽象和描述,可以构造丰富的概念间的语义关系,能够准确描述概念含义以及概念之间的内在关联;形式化能力最强,同时具有高度的知识推理能力,能通过逻辑推理获取概念之间的蕴涵关系。因此,本体是一种知识组织体系。以本体作为知识组织的技术和方法,能实现基于语义的知识检索。知识检索是传统信息检索的发展,随着人工智能、系统信息管理等相关高新技术的运用,提供个性化、智能化的主动信息服务也将是知识检索的发展方向。当前,图书情报档案的知识检索系统更加注重文本挖掘的功能,如大规模实例描述的汉语分词排歧知识库,具有主题词典和内容相似性检索功能,自动分类、聚类和自动摘要功能,文本数字理解和新词学习功能等。
  
  2 基于本体的知识检索模型
  
  2.1 信息检索模型的发展
  经典的信息检索模型包括布尔检索模型、向量空间模型和概率检索模型,目前大多数检索系统往往综合上述各种模型,以达到认为最佳的检索效果。这些检索模型的不足是:在文献的组织与描述上,采用词切分和单汉字或两者结合标引文献,将关键词作为描述文献的基本元素,文献之间是相互独立的;在检索操作上,是基于关键词的无结构查询,难以反映词语问各种语义联系,查询能力有限,误检率和漏检率很高;在模型约束方面,索引项之间独立性的要求不符合实际情况,计算查询和文档之间的相似度的方法也有局限;虽经不断完善,也难以从根本上适应网络巨量信息的检索。
  由此,一些学者从不同角度提出了基于知识的检索模型,如分类检索模型、多维认知检索模型、分布式检索模型、概念检索模型等。特别是概念检索模型克服了以往检索模型中以词及其权值为中心建立相关性而忽略了语义关联的缺点,以概念词典为辅助,采用人工智能技术,增强搜索引擎概念分析理解能力,从概念层面上来处理用户的查询请求,从而实现特定领域的概念检索。上述检索模型由于没有知识组织体系的支撑,没有实现对检索对象的语义标注,也没有对其语义进行解析,因此被解释为基于知识的信息检索模型。
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
全刊杂志赏析网 2016