-
题名基于统计特征的数学公式抽取方法的研究
被引量:3
- 1
-
-
作者
田学东
张立平
杨捧
-
机构
河北大学数学与计算机学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第19期211-213,共3页
-
基金
河北省自然科学基金资助项目(F2004000132)
-
文摘
在分析公式特征的基础上,提出了一种将Parezen窗和Bayes分类规则相结合的公式抽取方法。对于孤立式公式采用改进后的Parzen窗方法将其从文档中抽取出来,对于内嵌公式通过Bayes分类规则将其从文本行中抽取出来。实验表明,这种抽取方法对中文文档具有较好的适应性和较高的成功率。
-
关键词
OCR技术
数学公式抽取
Bayes法则
-
Keywords
OCR technique
Mathematical formulas extraction
Bayes theorem
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Parzen窗的印刷文档数学公式抽取的研究
被引量:4
- 2
-
-
作者
杨捧
田学东
-
机构
河北大学数学与计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第23期200-202,共3页
-
基金
河北省自然科学基金资助项目(编号:F2004000132)
-
文摘
数学公式抽取是公式识别的首要步骤,目前相关的研究还很欠缺。针对印刷文档中数学公式的抽取展开了研究,提出了一种Parzen窗和启发式规则相结合的公式抽取方法。对于孤立式公式采用Parzen窗方法将其从文档中抽取出来,对于嵌入式公式采用启发式规则将其从文本行中抽取出来。实验表明,这两种抽取方法的结合取得了较好的效果。
-
关键词
数学公式抽取
PARZEN窗
启发式规则
-
Keywords
mathematical formulas extraction,Parzen windows,heuristic rule
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于神经网络的印刷体数学公式抽取方法
被引量:1
- 3
-
-
作者
常新峰
崔键
刘晓蔚
田学东
-
机构
河北大学数学与计算机学院
河北大学图书馆
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第11期3483-3485,3500,共4页
-
基金
国家自然科学基金资助项目(60772073)
-
文摘
在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与BP神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用BP神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。
-
关键词
光学字符识别
特征提取
数学公式抽取
决策树
BP神经网络
-
Keywords
OCR
feature extraction
mathematical formulas extraction
decision tree
BP neural network
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名印刷文档中数学公式抽取的研究
被引量:1
- 4
-
-
作者
田学东
杨捧
张立平
苗秀芬
-
机构
河北大学数学与计算机学院
-
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2005年第5期545-548,共4页
-
基金
河北省自然科学基金资助项目(F2004000132)
-
文摘
数学公式抽取是公式识别的首要步骤,目前相关的研究还很欠缺.针对印刷文档中数学公式的抽取展开了研究,对于印刷文档中的孤立式公式采用Parzen窗方法将其从文档中抽取出来.实验表明,这种方法能够取得较好的效果.
-
关键词
数学公式抽取
PARZEN窗
孤立式公式
-
Keywords
mathematical formulas extraction
Parzen windows
isolated formulas
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-