互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

基于改进FP树的最大项目集挖掘算法


□ 谢志强 朱孟杰 杨 静

  (1.哈尔滨理工大学 计算机科学与技术学院, 哈尔滨 150080;2.哈尔滨工程大学 计算机科学与技术学院, 哈尔滨 150001) 
  摘 要:挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FPgrowth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP树,存在时空效率不高的问题。于是结合改进的FP树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。
  关键词:数据挖掘;关联规则;最大频繁项目集;频繁模式树
  中图分类号:TP311 文献标志码:A
   文章编号:10013695(2009)02050204
  
  Maximum frequent itemsets mining algorithm based on improved FPtree
  
  XIE Zhiqiang1,ZHU Mengjie1,YANG Jing2
  (1.School of Computer Science & Technology, Harbin University of Science & Technology, Harbin 150080, China;2.School of Computer Science & Technology, Harbin Engineering University, Harbin 150001, China)Abstract:Mining maximum frequent itemsets is a key problem in many data mining application. FPgrowth algorithm is one of the most efficient frequent pattern mining methods. However, FPgrowth algorithm must generate a huge number of conditional FPtrees recursively in processes of mining maximum frequent, so the efficiency of it unsatisfactory.This paper proposed an efficient mining maximum frequent algorithm, it unified the improvement FPtree.The FPtree was a oneway tree and there is no pointers to point its children in each node, so it saved the massive memories space.By introducing set of item sequences and its operators, the algorithm didn’t generate conditional FPtree or a large number ofcandidate sets in mining process, which could conveniently get all maximum frequent itemsets. The example analysis shows the algorithm is feasibility and effectiveness. ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017