互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

元搜索引擎研究综述评


□ 吴小兰 汪 琪

  [摘要]介绍元搜索引擎的起源与发展、基本原理和分类,重点从元搜索引擎关键技术的实现上阐述元搜索引擎研究的主要内容与进展,最后分析现有元搜索引擎存在的各种局限性,归纳出未来值得研究和探讨的若干方向。
  [关键词]元搜索引擎 个性化 信息检索
  [分类号]G353
  
  1 元搜索引擎的起源与发展
  
  Internet自诞生以来不断成长,信息容量呈爆炸性趋势增长。这一方面方便了人们获取信息;但另一方面也给人们查询信息带来了麻烦,常常使用户陷入“信息过载”和“资源迷向”的困境。搜索引擎的出现大大增强了人们收集信息的能力,但随着Web内容的飞速发展,信息膨胀速度远远超过了搜索引擎检索范围,一个搜索引擎通常不能找到用户所需的全部信息,用户在进行检索时需要在多个搜索引擎间进行切换,找到自己真正需要的信息仍如同大海捞针般困难。在这种情况下,一个能集合多个搜索引擎检索结果并能对此做出整合处理的检索工具——元搜索引擎出现了,它有效解决了独立搜索引擎信息覆盖率不足和查准率不高的问题。
  自1995年第一个元搜索引擎MetaCrawler推出以来,国外元搜索引擎技术迅速发展,目前网络中已经有上百个元搜索引擎,其中不乏优秀的元搜索引擎,如Mamma、MetaCrawler、SavvySearch等。国内的中文元搜索引擎发展较为缓慢且数目不多,如万纬、MetaFisher、北斗星等,其检索效果也不理想,未来发展空间很大。
  
  2 元搜索引擎的研究现状
  
  2.1 元搜索引擎的原理及其分类
  元搜索引擎(meta-search engine)是一种基于搜索引擎的搜索引擎,亦称“搜索引擎之母”。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将各独立搜索引擎返回的所有查询结果集中处理后再返回给用户。因此,元搜索引擎可根据检索的目标搜索引擎、检索提问处理方式以及如何编译与显示结果等的不同而划分为:集中罗列式元搜索引擎(又称“集成搜素引擎”或“all-in-one式搜索引擎”)和统一入口式元搜索引擎(又称“多线索式搜索引擎”);桌面型元搜索引擎和基于Web的元搜索引擎(也可称为“在线元搜索引擎”);并行处理式元搜索引擎和串行处理式元搜索引擎。
  
  2.2 元搜索引擎研究的主要内容与进展
  目前,元搜索引擎研究活动主要集中在以下几个关键技术的实现上:
  2.2.1 成员引擎的调度策略 提出了若干成员引擎的调度算法,典型的有:①普通法,即不考虑各个成员搜索引擎的特性,只是将元搜索引擎的查询请求简单地发送给自己的每个成员搜索引擎,用户可自由选择其成员引擎,如万纬搜索引擎;②定性法,如ALIWEB方法、NetSerf方法、D-WISE方法、gGLoss方法。它跟据一定的评分函数预测每个成员搜索引擎的质量;③定量法,根据一些比定性方法使用的衡量标准更易理解的标准来衡量成员搜索引擎的有用性,如估计有用文件的数量或估计最相似文件的相似度;④基于学习的方法,根据以往检索成员搜索引擎的经验预测各引擎对新查询的有用性。检索经验可能来自多方面,如静态学习方法MRDD方法、动态学习方法SavvySarch和混合学习方法ProFusion方法。在成员引擎的调度策略方面,国内的一些学者也提出了几种比较有特色的调度算法,如张卫丰等提出了一种基于遗传算法的调度算法来实现成员引擎的调度。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《图书情报工作》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017