互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

网络使用因子的缺陷及改进


□ 邓中华 陈小平

  [摘要]网络使用因子反映桌一国家或网站的网页指向其他网页能力的分布情况,可用于测度某一国家或网站的链接分布特征。网络使用因子自诞生起就不可避免的存在一些缺陷,尤其是假设前提、数据获取和算法本身等方面。建议开发专业链接分析工具,构建链接分类体系,对不同类型的链接进行加权得到“加权出链数”,并据此计算“加权网络使用因子”。
  [关键词]出链数 网络使用因子 链接分析工具 加权网络使用因子
  [分类号]G353.1
  
  在图书情报领域,链接分析已成为学术研究热点,从最初的介绍性研究到越来越多的实证研究,其研究日益深入实际应用。在实证研究中,某些链接指标备受争议。链接分析计量指标大体可分为4类:①链接数量特征计量指标:总链接数、出链数;②链接分布特征计量指标:链接密度、页面平均链接数、网络使用因子;③网站影响力计量指标:入链数、网络影响因子、链接倾向;④网页重要性计量指标:Pagerank算法、HITS算法等。因为对链接的讨论往往只涉及大学网站的入链数,而较少涉及大学网站的出链数,导致与出链数密切相关的网络使用因子在应用广泛性、受关注度方面逊色于网络影响因子(Web Impact Factors,WIF)。本文对网络使用因子在链接分析中存在的缺陷进行探讨,并提出一些改进意见。
  
  1 网络使用因子简介
  
  1.1 网络使用因子的起源及概念
  网络使用因子(Web Use Factors,WUF)是反映某一国家或网站的网页指向其他网页能力的分布情况的计量指标,可用来测度某一国家或网站的链接分布特征。长期以来,对链接的讨论只涉及大学网站的入链数,而没有涉及大学网站的出链数。直到2003年Thelwall M.等对出链所作的一项的研究才得出了“网络使用因子”(WUF)这一重要术语。究其原因有二:一是学者们认为入链比出链更有用,出链是由网站所有者控制的,比如出链可以由网站所有者创建;二是网站出链数是由一个单独的爬虫爬取的,与多个爬虫爬取的入链数相比,容易出现覆盖范围问题。例如,若某一网站中某些重要网页因其格式问题导致某爬虫无法爬取,则该爬虫爬取该网站的范围就会减小,从而对该网站的出链数产生不利的影响,但对所有其它网站的入链数影响很小,这些网站会丢弃覆盖范围低的网站的链接。
  WUF测度某一国家或网站的链接分布情况时,可用于计算网络的不同区域。如一个.comWUF可根据有.con域名的链接网页来计算。对网络不同区域在计算上的限制,要求对不同类型网页如国内、国际、教育、商业网页进行比较。另外,解释顶级域名如.tom、edu、uk的计算结果时必须谨慎,因为不能只从表面解释顶级域名。例如,.con域名应该用于商业领域,但是任何人都可以购买一个.com域名,并且在现实中,.com域名包含了庞杂无章的各类信息;即使是.edu域名也不局限于美国的大学。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《图书情报工作》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017