互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

基于元学习的分布式挖掘频繁闭合模式算法研究


□ 琚春华 倪栋君

   (浙江工商大学 计算机与信息工程学院, 杭州 310018)
  
  摘 要:利用元学习技术提出了一种分布式挖掘频繁闭合模式算法;为适应不同的分布式环境,还给出了该算法的一个变种;最后通过实验讨论了不同分布式下选取算法的策略。算法具有挖掘效率高、通信量少、可靠性高的特点,适合分布式挖掘。
  关键词:数据挖掘; 频繁闭合模式; 分布式挖掘; 元学习
  中图分类号:TP301.6 文献标志码:A
   文章编号:10013695(2009)01004103
  
  Study of algorithm for distributed mining frequent closed
  patterns based on metalearn technology
  JU Chunhua, NI Dongjun
  
  (College of Computer & Information Engineering, Zhejiang Gongshang University, Hangzhou 310018, China)
  
  Abstract:This paper presented a distributed algorithm for mining frequent closed patterns using metalearning. In order to accommodate the different distributed environment, also presented another similar algorithm. In the end, discussed the strategy for choosing the right distributed algorithm by experiment. This algorithm is more efficient and has less communicated and high reliability, applicable to distributed mining well.
  Key words:data mining; frequent closed patterns; distributed mining; metalearning
  
  频繁模式挖掘在数据挖掘领域有着广泛的应用。虽然频繁模式的挖掘在近些年来被深入研究,也提出了一些比最初的Aprior算法[1]性能更好的算法,但是一旦支持度降低或数据倾斜,频繁模式的数量就会急剧增加,这些算法的性能也将急剧下降。用频繁闭合模式挖掘代替频繁模式挖掘是近年来提出的新策略。频繁闭合模式集合包含了频繁模式集合的全部信息,但数量前者通常比后者要小很多。此外,由频繁闭合模式集合可直接产生无冗余的关联规则。近年来随着分布式环境的日益普遍,而现有的挖掘频繁闭合模式算法如AClose[2]、CLOSET+[3]、CHARM[4]等都是针对单处理器、单一数据集,不适用分布式环境。所以研究分布式下的挖掘频繁闭合模式算法具有重要意义。本文在已有挖掘闭合模式算法的基础上,针对频繁闭合模式和分布式环境的特点,提出利用元学习技术并行地在各个站点挖掘局部频繁闭合模式;然后根据不同的分布式环境采用不同的学习策略,最终挖掘出全局频繁闭合模式。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017