互联网 qkzz.net
全刊杂志网:首页 > 女性 > 文章正文
刊社推荐

基于神经网络的印刷体数学公式抽取方法常新峰 崔 键 刘晓蔚 田学东


   (河北大学 a.数学与计算机学院;b.图书馆, 河北 保定 071002)

  摘要:在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与bp神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用bp神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。

  关键词:光学字符识别;特征提取;数学公式抽取;决策树;bp神经网络

  中图分类号:tp39141文献标志码:a

  文章编号:1001-3695(2008)11-3483-03

  

  research on mathematical formulas extraction from printed document

  based on neural network

  chang xin-fenga,cui jiana,liu xiao-yub,tian xue-donga

  (a.college of mathematics & computer, b.hebei university library, hebei university, baoding hebei 071002, china)

  abstract:on the basis of the analysis of typographic information and character feature on printed document, an approach combining decision tree and bp neural network was proposed to extract mathematical formulas. decision tree method was used to extract the isolated formulas lines. bp neural network was used to extract the embedded formulas from the text lines. the experiments show the methods can achieve satisfactory results.

  key words:ocr; feature extraction; mathematical formulas extraction; decision tree; bp neural network

  0引言

  目前,ocr(光学......

很抱歉,暂无全文,若需要阅读全文或喜欢本刊物请联系《计算机应用研究》杂志社购买。
欢迎作者提供全文,请点击编辑
分享:
 

了解更多资讯,请关注“木兰百花园”
分享:
 
精彩图文


关键字
支持中国杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 网站声明 | 刊社管理 | 网站地图 | 联系方式 | 中图分类法 | RSS 2.0订阅 | IP查询
全刊杂志赏析网 2017