互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

基于动态文档集的索引技术


□ 潘隆禧 孙 乐

   (1.中国科学院 软件研究所, 北京 100190; 2.中国科学院 研究生院, 北京 100049)
  
  摘 要:倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据越来越大。同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。
  关键词:倒排表; 索引的建立; 索引更新
  中图分类号:TP391 文献标志码:A
   文章编号:10013695(2009)01001504
  
  Index technique for dynamic corpus
  PAN Longxi1,2, SUN Le1
  
  (1.Institute of Software, Chinese Academy of Sciences, Beijing 100190, China; 2.Graduate School, Chinese Academy of Sciences, Beijing 100049, China)
  Abstract:Inverted list is the main data structure used in IR. The offline index construction about static corpus has been under research for a long time. As the development of computer, thedatacapacity become larger and larger and in some specific domains such as news search and desktop search which demand high quality about index update, all of these needs us to find a efficient index update way. This paper described and analyzed several efficient index update strategy in common use.
  Key words:inverted list; index construction; index update
  
  0 引言
  全文检索技术在人们的生活中发挥了重要的作用,小到文件查找,大到图书馆检索、搜索引擎等领域。传统的全文检索技术更多的是着重于静态文档集合索引的建立,但是随着数据量的增加和变化,单纯的静态索引已经不能满足应用要求,索引更新是必需的。这就需要找到一种有效的动态更新倒排索引策略。本文综述了面向动态应用环境如新闻搜索、桌面搜索领域。对索引实时更新要求比较严格的应用技术,通常称之为动态索引技术或在线索引技术。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017