互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

一种新型的基于URL过滤的反垃圾邮件技术



  摘要:在深入分析了传统垃圾邮件过滤技术不足的基础上,提出并实现了一种新型的基于URL过滤的垃圾邮件过滤技术(URL based spam filtering,UBSF)。该方法通过对比从到来邮件中提取的URL与URL库中存储的URL信息的相似性来判定垃圾邮件。通过语料库以及构建实际系统原型的测试,表明该方法具有准确性高、误报率低以及实时处理速度快的优点。
  关键词:网络安全;垃圾邮件过滤;URL过滤的垃圾邮件过滤技术;统一资源定位符库
  中图分类号:TP393.08文献标志码:A
  文章编号:1001-3695(2008)05-1537-03
  
  随着Internet的发展,电子邮件在给人们带来巨大便利的同时,也诱使有些人将之作为大量散发自己信息的工具,最终导致了互联网中垃圾邮件的泛滥。垃圾邮件消耗了大量的网络资源,并给人们带来了极大的不便。人们平均每天需要花费5~10 min清理邮箱中的垃圾邮件。据统计,目前互联网上的垃圾邮件总数量已经达到25%以上。在中国和美国,这种情况更加糟糕,超过50%的邮件都是垃圾邮件。更为严重的是,有的垃圾邮件带有恶意代码,这些都直接威胁到了用户系统的安全。如何有效地防范垃圾邮件,已经成为网络信息安全领域的一个经典难题。
  伴随着垃圾邮件的迅速增加,人们为对付垃圾邮件而进行的技术研究也迅速发展起来。人们与垃圾邮件的对抗已经持续了十多年。到目前为止,至少有8~10种以上基本的邮件过滤技术,它们被单独或组合起来共同抵抗垃圾邮件的袭击。然而,当前的垃圾邮件技术存在着误报率高、处理开销大、无法应对大规模网络环境下的实时处理应用的需求等缺陷。
  本文描述了在反垃圾邮件方面的相关研究工作,设计并实现了基于URL过滤的反垃圾邮件技术,并给出了基于该技术的实验结果及分析。
  
  1相关工作
  
  目前,反垃圾邮件技术大致可以分成如下几类:接入控制方法,包括黑名单、白名单、灰名单以及延迟技术;身份验证方法,包括DNS MX查询、反向DNS解析[1];内容过滤技术,包括基于规则的RIPPER方法[2]、基于统计的贝叶斯方法[3]、ME(最大熵)模型[4]、SVM(支持向量机)方法[1]等,以及2005年最新出现的基于URL精确匹配过滤[5]和基于URL聚类的过滤方法[6]。
  事实证明,复合使用多种技术在实践中可能会取得比较好的效果。在上述抑制垃圾邮件的各种方法中,基于内容的过滤逐渐显示出了其技术优势。尤其是基于机器学习的方法,不但准确率高,而且可以自动地学习区别合法邮件和垃圾邮件的特征,省去了大量人力,并且可以随着邮件的增加而不断进化,过滤的邮件越多分类就越准确。 ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017