互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

一种可靠信任推荐文本分类特征权重算法


摘 要:从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。
  关键词:文本分类; 特征权重; 可信计算; 概率确定性密度; 自然语言处理
  中图分类号:TP181
  文献标志码:A
  
  文章编号:1001-3695(2010)02-0472-03
  doi:10.3969/j.issn.1001-3695.2010.02.0018
  
  Reliable trust recommendation model for feature weighting in text categorization
  
  JIAO Qing-zheng1,2, WEI Cheng-jian1
  
  (1. College of Information Science & Engineering, Nanjing University of Technology, Nanjing 210009, China; 2. Information Management Center, Anhui Normal University, Wuhu Anhui 241000, China)
  
  Abstract:By reliable trust recommendation, used a feature weighting approach to construct the simplest linear weighting classifier in the procedure of which characteristics of feature were explored, while the trust relationship between features and categories was developed based on Beta distribution function. Experiments with 20newsgroup and Fudan Chinese evaluation data collection reported shows that this new algorithm generally outperformed TFIDF, and has good adaptability to non-equilibrium corpus. ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017