互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

网络信息计量学与搜索引擎研究


□ 张 洋

  摘要 认为搜索引擎是网络信息计量研究中重要的数据收集工具,但也存在着覆盖率低等不足之处,开发专业搜索引擎将是未来的发展重点;另一方面,搜索引擎还是网络信息计量学的重要研究对象,其研究内容包括评价研究、应用研究和改进研究三个方面,所取得的研究成果可以有力地促进搜索引擎的发展。
  关键词 网络信息计量学 搜索引擎 数据收集
  分类号 G350
  
  随着互联网(Internet)的不断扩展和功能的不断增强,搜索引擎(Search Engine)在网络社会中的地位日益重要。对于科学工作者来说,搜索引擎研究已成为诸多科学领域所关注的焦点。但是,在情报学领域,人们对“搜索引擎”的认识始终停留在“工具”的层面。即使有所尝试,也因为缺乏合适的切入点,而难以真正介入到这一热门的研究领域中。本文的讨论正是在这一背景下提出来的。我们认为,搜索引擎既是网络信息计量学的重要研究工具,也是重要的研究内容,两者之间存在着十分密切的联系,对两者进行综合研究具有十分重要的科学意义和广阔的发展前景。
  
  1 搜索引擎在网络信息计量研究中的应用
  
  1.1 搜索引擎的重要作用
  对于任何计量科学研究来说,系统、全面地收集所需要的原始数据都是开展研究的基本前提。因此,数据收集方法始终是网络信息计量学重点研究的问题。
  目前用于网络信息计量研究的原始数据主要有两种来源:结构化或半结构化的数据资源,主要是连接到互联网上的各种专用数据库,包括各种联机信息系统、引文索引、全文数据库、专题网站等。这类数据资源属于高度组织化的信息资源,并配备有专用的信息检索工具,使用方便,数据可靠,但数量有限,成本较高,而且其数据一般都不能直接用于网络信息计量研究,需要进一步挖掘;非结构化数据:网上拥有大量的自然语言文本、图像、声音等数据,无法用统一的结构表示,被称为“非结构化数据”。这类数据中隐含着许多非常有价值的信息,如能加以开发利用,将产生巨大的效益。但是,由于具有内容丰富、类型多样、数量巨大、结构复杂、变化频繁、质量不一等特点,对其进行开发利用的难度很大。就目前来看,人们主要依靠各种商业“搜索引擎”来搜集这类“非结构化数据”。
  网络信息计量学作为一门以“网络信息”为研究对象的计量学科,自其诞生之日起,就与搜索引擎结下了不解之缘。从最早的T.C.Almind和Peter Ingwersen所做的研究开始,一直到今天,相当多的网络信息计量学研究者都依靠搜索引擎来收集数据。所用到的搜索引擎也是种类繁多,特点各异,包括AltaVista、AUTheWeb、Northernlight、Google、Excite、Lvcos、HotBot、Infoseek等在内的众多知名搜索引擎都曾被应用于数据搜集工作中。可以说,没有搜索引擎,网络信息计量学就失去了有效的研究手段,不可能得到如此迅速的发展,搜索引擎无疑是当前网络信息计量研究中最重要的数据收集工具之一。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《图书情报工作》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017