互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

用Capture Recapture方法估计Web数据库大小


□ 苗忠义 胡鹏昱 崔志明

  (苏州大学 智能信息处理研究所 江苏 苏州 215006)
  
  摘 要:为了估计网络数据库的大小,提出了基于CaptureRecapture过滤二字亲密、二字排斥的方法。通过在接口文本框提交属性高频字,利用返回的结果集,在两两之间作交集,根据交集中的两字分布分析采样的独立性,过滤掉其中不独立的情况,再利用CaptureRecapture方法估计网络数据库的大小。在模拟和真实的环境下进行了实验,该方法偏差度和波动度均较小。
  关键词:大小估计; 深网; 网络数据库
  中图分类号:TP311 文献标志码:A
  文章编号:1001-3695(2009)05-1754-03
  
  Using CaptureRecapture approach estimate size of Web databases
  MIAO Zhongyi HU Pengyu CUI Zhiming
  (Institute of Intelligent Information Processing & Application Suzhou University Suzhou Jiangsu 215006 China)
  Abstract:In order to estimate the size of Web database this paper proposed the CaptureRecapture based estimation methods that filtered out two words intimate and rejection cases. Submitting attributed highfrequency words in the text box of query interface using the returned result in the intersection of two results analyzing the independence of two sampling filtering the dependent couples and then using CaptureRecapture method estimated the size of Web database. In the simulated and real environment for the experiment the bias and the volatility of the method are smaller.
  Key words: size estimation; Deep Web; Web database ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017