互联网 qkzz.net
全刊杂志网:首页 > 大学学报 > 文章正文
刊社推荐

可视化同被引分析技术综述


□ 李运景 侯汉清 薛春香 任银铃

  摘要 可视化同被引分析步骤主要包括选择数据源、确定分析的元素、计算同被引频次、对数据进行标准化处理、对数据进行降维和图示、对图形进行分析解释。这些步骤中的关键技术在于对获得的高维引文关系数据进行降维和图示,目前应用较多的主要有聚类分析、多维尺度分析、因子分析、自组织映射神经技术、寻径网络技术、最小生成树法、三角测量、力矢量布局算法等。其中寻径网络技术以其较好的图示效果得到较多的应用。
  关键词 同被引分析 可视化 技术
  分类号 G354.2
  
  随着信息可视化技术的发展,文献计量学中的引文分析越来越多地借鉴信息可视化的技术,以形象、直观的图形方式显现分析结果,使得结论更加具有说服力。在各种引文分析方法中,利用信息可视化技术最多的应属同被引分析。最近几年,通过可视化同被引分析生成学科知识图在国外得到了蓬勃的发展,并被应用于科学结构的图示、知识领域的显现、学科前沿预测等方面。本文将对可视化同被引分析中涉及的一些关键技术进行分析和介绍,希望能够对我国可视化同被引分析的研究与应用起到抛砖引玉的作用。
  
  1 同被引的概念
  
  同被引(co-citation)的概念是由美国人Henry Small在1973年提出的,他最初是以文献为单位进行分析的,即如果两篇论文a和b被一篇后来的文献C同时引用,则a与b之间的关系称为同被引关系。同时引用a和b的文献越多,则a和b之间的关系越近,内容上的相似度越大。继HenrySmall之后,1981年美国人Howard D.White把同被引的概念扩展到著者,进行了著者同被引分析。之后,学者们把同被引分析扩展到了学科、期刊甚至类目等,形成了文献同被引分析、著者同被引分析、学科同被引分析、期刊同被引分析、类目同被引分析等。虽然分析对象不同,但这些不同类型的同被引分析有一个共同原理,就是同时引用两个单元的文献越多,则这两个单元之间的同被引强度越大,两者的关系越紧密。
  
  2 可视化同被引的步骤和关键技术分析
  
  可视化同被引分析的步骤,包含以下几个过程:①根据要进行的研究选择合适的数据源,抽取数据;②选定要分析的元素对象,例如期刊、论文、著者、类目等;③计算元素对象之间的同被引频次,构造原始同被引频次矩阵;④确定合适的相似度算法对原始同被引频次矩阵进行标准化处理;⑤用一定的算法把多维数据在二维或三维空间中聚合并图示出来;⑥对图形进行分析和解释。
  考虑到操作和应用的便利,目前的一些可视化软件常常把上述步骤中的④和⑤集成到一起供用户选择使用。由于可视化同被引分析是一个比较复杂的过程,以上每个步骤涉及到的技术也有很大差异,下面对这些关键技术进行简要的对比分析。
  
  2.1 数据源的选择
  进行同被引分析首先需要计算数据元素之间的同被引次数,这一般要依托某一引文数据库的相关统计数据来进行,但是元素之间的同被引次数的多寡有可能随所选择引文数据库的不同而有所区别。以我国中国科学院推出的《中国科学引文数据库》和清华同方推出的《中国引文数据库》为例:2007年3月,以同样的数据获取方式计算我国水稻研究专家袁隆平和程式华的同被引次数,在《中国科学引文数据库》中,两者的同被引次数为2;而在《中国引文数据库中》,两者的同被引次数则是6。造成这一差别的原因是两个数据库的期刊收录范围大小不一样,前者只收录核心刊,后者收录范围则比较广。因此,作为同被引分析数据源的引文数据库的选择十分重要,既要保证最后计算所得的同被引次数不能过低,也要兼顾数据库所选择期刊的标准,因为引文数据库期刊收录范围如果过于庞杂,容易使论文被引用作为影响力的测度标准失去公正性,被高水平的学术期刊引用一次和被一般推广性科普杂志引用一次显然是不等价的。国外学者做同被引分析一般选用《美国科学引文数据库》(简称SCI)作为数据源。而国内目前可用的具有引文检索功能的数据库较多,这就需根据将要分析的专业学科范围以及同被引次数获得的难易程度来选择。国内的几个数据库中能够直接检索获得同被引频次的有清华同方的《中国学术期刊全文数据库》和重庆维普公司的《中国科技期刊数据库》,对于其他几个引文数据库,则必须根据下载的引文数据,利用一定的程序进行计算,才能得到同被引频次。
  
  2.2 分析元素对象的确立
  这里的元素对象既可以是期刊,也可以是成篇的文献,或者是著者,或者是类目,甚至是学科类别。数据元素不同,所得到的学科知识图反映的内容和作用也有所不同。
  用期刊或类目或学科类别作为分析元素时,往往能够图示出科学的宏观结构,可以显示出比较大的主要学科专业之间的相对位置和关系,但有时也被用于对某一学科内各专业分支之间关系的图示分析。例如,Kevin W Boackv、LoetLeydesdorff、J.M.Campanario、I.Samoylenko等人就分别对期刊引用关系进行可视化分析,展示了大科学的结构;而Kevin W.Boacky在其另一篇论文中,则用期刊引用数据对有关科技管理这一学科的领域结构进行了可视化显示。
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文
关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | EMS快递查询
全刊杂志赏析网 2016