互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

专题新闻文本集信息可视化研究


□ 安海忠 崔 娜

  [摘要]根据新闻要素说,提取专题新闻文本中的关键词并进行预处理;采用向量空间模型表示文本,运用K—means算法实现文本聚类并构建关键词关联网络模型以实现文本的可视化。实例表明:该方法能直观地显示专题新闻文本集的主要信息,便于快速掌握新闻中的主体与事件的关系以及新闻关注点随时间的变化,从而加深对信息的理解,有利于信息的充分利用。
  [关键词]信息可视化 文本信息 关联网络模型
  [分类号]G203
  
  1 引言
  
  面对大量的新闻信息,人们迫切需要了解信息之间的相互关系及发展趋势,发现隐藏在其中的本质特征和规律。可视化技术可以直观地展示新闻文本中的大量信息及其之间的关系,便于人们理解、掌握信息。
  信息可视化是指非空间数据的可视化。Card等将信息可视化定义为:“使用计算机支持、交互性的视觉表示法,对抽象数据进行表示,以增强认知”。也就是说,信息可视化是使用直观的方式展现原始数据间的复杂关系、潜在信息以及发展趋势,其目的是为了更好地利用信息资源。关于信息可视化的研究主要集中在三个方面:理论介绍、算法与模型的介绍以及实际应用。20世纪90年代是信息可视化研究的初期,主要是理论的介绍,包括信息可视化的概念、内涵、研究内容等。其中,文本信息可视化是信息可视化的一种,可以分为两类:一类是对单文档的可视化;另一类是对多文本(文本集)的可视化。而基于时间信息的可视化模型是信息可视化研究领域的热点问题之一,如时间墙模型和主题河流模型。这两种模型都以时间为水平轴线展示文本信息,以发现文本主题的发展趋势和隐含信息。此外,信息可视化模型还包括关联分析模型和RDV模型。文本信息可视的方法主要有图符标识法、高维空间描述法、自组织地图算法及群集映射法。文本信息可视化的应用研究主要集中在文献领域。如:Young Gil Kim等实现了专利文献的可视化;Josiane Mothe则通过将文本在地图上的可视化显示,进行信息挖掘。在国内,郑珩等针对国内管理科学文献进行可视化研究,任智军等研究了科技文献中的可视化分析技术。
  现已提出的文本信息可视化模型大都按时间关系建立,能直观显示时间上文本间的关联,而对文本间深层次信息实体间的关联则难以体现,导致现阶段文本信息可视化未能挖掘出文本中深层次的信息,仅停留在统计分析的基础之上。因此,本文根据专题新闻文本集的特点,借助网络,针对新闻文本内容,构建专题新闻文本集信息可视化模型,并以新浪网上四川汶川地震专题中关于灾后重建的新闻文本集为例进行实证研究。
  
  2 专题新闻文本集信息可视化流程
  
  专题新闻文本集是多个关于某个专题新闻文本的集合,其可视化流程基本分为以下5个步骤。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《图书情报工作》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017