互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

面向新闻视频内容分析的音频分层分类算法


□ 冀 中 苏育挺 宋星光 安 欣

  (天津大学 电子信息工程学院 天津 300072)
  
  摘 要:提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐三类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和音乐六类。实验结果表明,男主持人语音、女主持人语音以及音乐的分类效果最好,查准率和查全率均可达90%以上;交替报道的分类性能最差,查准率为57.5%,查全率为79.3%;其他类别的分类性能居中,在70%~90%左右。与同类算法相比,该算法分类性能较高。
  关键词:音频分类; 内容分析; 隐马尔可夫模型; 新闻视频; 视频检索
  中图分类号:TP391文献标志码:A
  文章编号:1001-3695(2009)05-1673-03
  
  Hierarchical audio classification algorithm for news video content analysis
  JI Zhong SU Yuting SONG Xingguang AN Xin
  (School of Electronic & Information Engineering Tianjin University Tianjin 300072 China)
  Abstract:This paper proposed hierarchical audio classification algorithm which first classified the news audio stream into silence speech and music with rulebased classifier and then employed hidden Markov models to categorize the speech and music to maleanchor speech femaleanchor speech alternate speech monologue speech live report and music. The experiment results show that the classification works best in maleanchor speech,femaleanchor speech and music in which precision and reall can both reach more than 90%. The classification performs worst in alternate speech with precision of 57.5% and with recall of 79.3%. The performance of classification in other types is at the average level with precision and recall ranging from 70% to 90%. Compared with the other representative algorithm this method works well with relatively high precision. ......
很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017