互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

情报检索发展的几个前沿问题


□ 屈 鹏 李 璐 张丽丽

  [摘 要]介绍现阶段情报检索研究中的几个前沿问题,包括自然语言检索、跨语言检索、智能信息检索、基于语义的图像和视频检索及检索系统评价研究的最新发展情况。语言、智能和语义等问题相互关联,近年来又一同推动着信息检索的发展。检索评价研究也有针对性地引导着情报检索的发展方向。结语部分论述这些问题在情报检索前沿发展中的本质联系及未来的发展方向。
  [关键词]自然语言检索 跨语言检索 智能检索 基于语义的检索 检索系统评价
  [分类号]G252
  
  近年来,自然语言检索、跨语言检索、智能信息检索和基于内容的检索发展较快,成为情报检索研究中的前沿和热点问题。基于内容的检索将情报检索的研究对象从文本扩展到多媒体信息资源,基于概念的检索是其进一步发展,后者同时将多媒体信息资源的物理内容与用户的认知语义结合起来,在内容的基础上纳入用户的认知和情感等因素。本文就是在当前发展现状的基础上,论述这四个问题。同时,介绍情报检索的评价研究,它指导着情报检索的发展方向,尤其是TREC,堪称信息检索系统研究的指南针和风向标。
  
  1 自然语言检索的语义问题
  
  语义问题是自然语言检索中的核心问题。目前,情报检索仍是“bag of words”的检索方式,因而词汇的意义(Meaning),即语义(Semantic)便处在举足轻重的位置。但是,考虑到效率和及时性因素,对语义的建模和计算不能使用过于复杂的模型。目前,可以通过两种途径来解决这一问题:一是通过概率统计的方法;另一是通过本体的方法。
  
  1.1通过概率统计的方法解决语义问题
  语言模型(Language Model)是近年情报检索领域的研究前沿。这一概念最初用于语音识别,是指针对词序的统计模型。在情报检索中引入语言模型可以:①直接用于情报检索的概率模型;②彰显情报检索模型中统计估值的重要性t③对给定查询q,判定某一文献d的分值p(q|d)。现有的语言模型研究的前提假设较之以往的概率模型并没有太大改变。但是,对于其中参数的估值更为显式化,也更加精准。翟成祥和Lafferty则深入到语言模型中的平滑手段,在比较几种平滑算法的基础上,提出应用于自然语言检索2阶段平滑,并认为Jelinek-Mercer可用于查询建模。Liu Xiaoyong和Croftw.B.介绍了在语言模型中主要使用的查询、翻译和相关三种模型以及参数和语义两种平滑方法。
  概率统计方法解决语义问题的第二种方法是词义消歧。传统的情报检索中通常使用聚类、主成份分析和潜在语义索引等方法实现。而在自然语言处理中,词义消歧通常通过统计学习的方法实现。两者相比,前者的效果不如后者,但是开销小;后者能够使消歧的效果更精准,但是不适合用于提供在线服务。K.Sparck Jones认为在使用自然语言处理的方法处理情报检索问题时要“吝啬”。结合实际情况而言,这样的思想不无道理。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《图书情报工作》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


相关刊物
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017