互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

新型频繁项集快速挖掘模式树的方法


□ 王静红 刘丽娜 耿宗科

  摘 要:在FP_growth算法中,FP_tree及条件FP_tree的构造和遍历占了算法绝大部分的时间,为了能减少这方面的时间,提出了一种新型快速的方法——改进的层次频繁模式树(inproved hierarchy FP_tree,IHFP_tree)。该方法采用首先对数据库扫描一遍,产生每个项的等价类;然后去掉不频繁项,对等价类进行重新改写;最后再创建FP_tree。引入层次频繁模式的概念,在挖掘过程中大大提高了算法的时空效率。与其他频繁模式挖掘的常用算法进行了时间复杂度和空间复杂度的比较,实验表明,IHFP_tree的挖掘速度比FP_tree方法要快得多。
  关键词:FP_tree; IHFP_tree; 频繁模式; 等价类
  中图分类号:TP301.6 文献标志码:A 文章编号:1001-3695(2008)08-2325-03
  
  Research on new mining algorithm of frequent itemset
  WANG Jing-hong1, LIU Li-na2, GENG Zong-ke1
  (1. Collgeg of Information Technology, Hebei Normal University, Shijiazhuang 050091, China; 2.Hebei Agricultural University, Qinhuangdao Hebei 066004, China)
  Abstract:In FP-growth algorithm, it costs most of the time in constructing and traversing the FP-tree and conditional FP-tree.In order to constructing the FP_tree efficiently, this paper proposed a new fast algorithm called inproved hierarchy FP_tree (abbreviate IHFP_tree). The algorithm firstly scaned the database only once for generating equivalence classes of each item. Then deleted the non-frequent items and rewrote the equivalence classes of the frequent items, and then constructed the IH FP_tree.
  Key words:FP_tree; IHFP_tree; frequent pattern; equivalence class ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017