互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

基于衰减窗口与剪枝维度树的实时数据流聚类


□ 张晓龙 曾 伟

  (武汉科技大学 计算机科学与技术学院, 武汉 430081)
  
  摘 要:
  提出一种基于衰减窗口的实时数据流聚类算法PDStream。算法首先对数据空间进行网格划分,采用改进的维度树结构维护和更新数据流的摘要信息,设计了一种周期性剪枝策略,周期性地剪去维度树中的稀疏网格,最后采用深度优先搜索算法在线处理聚类请求。基于人工数据集和真实数据集的实验表明,PDStream算法可以有效地发现数据流中任意形状的聚类,内存消耗少,具有较好的计算精度。
  关键词:数据流; 网格聚类; 衰减窗口; 维度树; 剪枝策略
  中图分类号:TP311文献标志码:A
  文章编号:1001-3695(2009)04-1331-04
  
  Real-time data stream clusteringbased on damped window and pruning dimension tree
  
  ZHANG Xiao-long, ZENG Wei
  
  (School of Computer Science & Technology, Wuhan University of Science & Technology, Wuhan 430081, China)
  
  Abstract:
  This paper proposed a novel real-time data stream clustering algorithm PDStream, which was based on damped window. PDStream firstly divided data space into grids, then used an improved dimension tree structure to maintain and update the data stream summary statistics. Designed a pruning strategy to prune the sparse grids in dimension tree periodically. Finally used the depth first search (DSF) method to deal with online clustering request. The experimental results on synthetic dataset and real dataset demonstrate that PDStream has the advantages of discovering clusters of arbitrary shape effectively, low memory consumption, preferable precision. ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017