基于最大-最小相似度学习方法的文本提取被引量：1

Text Extraction Based on Maximum-Minimum Similarity Training Method

下载PDF

导出

摘要应用最大-最小相似度(maximum-minimum similarity,简称MMS)学习方法,对基于高斯混合模型的文本区域提取方法中的有关参数进行优化.该学习方法通过最大化正样本相似度和最小化反样本相似度获得最佳分类能力.根据这种判别学习思想,建立了相应的目标函数,并利用最速梯度下降法寻找目标函数最小值,以得到文本区域提取方法的最优参数集合.文本区域提取实验结果表明:在用期望最大化(expectation maximization,简称EM)算法获得参数的极大似然估计值后,使用最大-最小相似度学习方法,使文本提取综合性能明显提高,开放实验的召回率和准确率分别达到98.55%和93.56%.在实验中,最大-最小相似度学习方法的表现还优于常用的判别学习方法——最小分类错误(minimum classification error,简称MCE)学习方法. This paper proposes a maximum-minimum similarity training algorithm to optimize the parameters in the effective method of text extraction based on Gaussian mixture modeling of neighbor characters. The maximum-minimum similarity training （MMS） methods optimize recognizer performance through maximizing the similarities of positive samples and minimizing the similarities of negative samples. Based on this approach to discriminative training, it defines the objective function for text extraction, and uses the gradient descent method to search the minimum of the objective function and the optimum parameters for the text extraction method. The experimental results of text extraction show the effectiveness of MMS training in text extraction, Compared with the maximum likelihood estimation of parameters from expectation maximization （EM） algorithm, the training results after MMS has the performance of text extraction improved greatly. The recall rate of 98.55% and the precision rate of 93.56% are achieved. The experimental results also show that the maximum-minimum similarity （MMS） training behaves better than the commonly used discriminative training of the minimum classification error （MCE）.

作者付慧刘峡壁贾云得

机构地区北京理工大学计算机科学与技术学院智能信息技术北京市重点实验室

出处《软件学报》 EI CSCD 北大核心 2008年第3期621-629,共9页 Journal of Software

基金 Supported by the National Natural Science Foundation of China under Grant No.60473049 (国家自然科学基金) the National Basic Research Program of China under Grant No.2006CB303105 (国家重点基础研究发展计划(973)) the Excellent Young Scholars Research Fund of Beijing Institute of Technology of China under Grant No.2006Y1202 (北京理工大学优秀青年教师资助计划)

关键词文本提取高斯混合模型判别学习最大-最小相似度学习最小分类错误学习 text extraction Gaussian mixture modeling discriminative training maximum-minimum similarity training minimum classification error training

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1陈又新,刘长松,丁晓青.复杂彩色文本图像中字符的提取[J].中文信息学报,2003,17(5):55-59. 被引量：10
2付慧,刘峡壁,贾云得.用于文本区域提取的边缘像素聚类方法[J].计算机辅助设计与图形学学报,2006,18(5):729-734. 被引量：6
3于浩,高剑峰,步丰林.一种新的语言模型判别训练方法[J].计算机学报,2005,28(10):1708-1715. 被引量：2
4孙广玲,刘家锋,唐降龙,石大明,赵巍.基于主动判别函数的手写体识别(英文)[J].软件学报,2005,16(4):523-532. 被引量：2
5刘洋,薛向阳,路红,郭跃飞.一种基于边缘检测和线条特征的视频字符检测算法[J].计算机学报,2005,28(3):427-432. 被引量：20
6韩纪庆,高文.Robust Speech Recognition Method Based on Discriminative Environment Feature Extraction[J].Journal of Computer Science & Technology,2001,16(5):458-464. 被引量：2

二级参考文献61

1A. K. Jain and B. Yu. Automatic text location in images and video frames [C]. Proceedings of 14th International Conference on Pattern Recognition, pages 1998. 1497- 1499.
2X. W. Wang, X. Q. Ding, C. S. Liu. Character Extraction and Recognition in Natural Scene Images[C]. Proc. of ICDAR'2001, 1084-1088.
3H. Goto and H. Aso. Character Pattern Extraction from Colorful Documents with Complex[C]. Proceedings of 16th International Conference on Pattern Recognition, ICPR2002, Aug. 2002,Canada.
4C. Li, X. Q. Ding, Y. S. Wu. Automatic Text Location in Natural Scene Images [C]. Proc. of ICDAR'2001, 1069- 1073.
5X. W. Wang, X. Q. Ding, C. S. Liu. Gray-scale Character Image Recognition Based on Fuzzy DCT Transform Features [C]. Proc. of ICPR'2000, 235-238.
6Han J，Proc IEEE 1998 Int Conf Acoust Speech（ICASSP'98）Signal Processing，1998年，81页
7Juang B，IEEE Thins Speech Audio Processing，1997年，5卷，3期，257265页
8Rathinavelu C，IEEE Thins Speech Audio Processing，1997年，5卷，3期，243页
9Han J，Proc 1997 Europ Conf Speech Communication and Technology（Eurospeech'97），1997年，1531页
10Gales M，Comput Speech Lang，1995年，9卷，289页

共引文献35

1彭媛,周军.一种基于线条分类的视频文字检测算法[J].电视技术,2009,33(S1):136-138.
2欧文武,朱军民,刘昌平.自然场景文本定位[J].中文信息学报,2004,18(5):42-47. 被引量：17
3孟丽,徐法升,李金屏.基于直方图差分的视频分类方法[J].济南大学学报（自然科学版）,2007,21(2):100-103. 被引量：4
4袁伟,高剑峰,步丰林.语言建模中最小化样本风险算法的研究和改进[J].软件学报,2007,18(2):196-204.
5付慧,刘峡壁,贾云得.图像中多语种文本提取的高斯混合建模方法[J].计算机研究与发展,2007,44(11):1920-1926. 被引量：2
6赵永辉,刘长松.香港车牌识别算法设计[J].电视技术,2007,31(B08):140-142.
7刘世与,曹作良.复杂色彩单帧图像中的文字提取[J].天津理工大学学报,2007,23(6):58-61. 被引量：1
8童小念,李娜.复杂背景下字符提取算法的分析与实现[J].东北师大学报（自然科学版）,2008,40(1):40-44. 被引量：3
9江延湖,白似雪.复杂背景图像文本信息提取技术研究[J].江西教育学院学报,2008(3):18-21.
10蒋瀚洋,郑光勇,范双南.基于媒体特征的多媒体信息检索技术的研究[J].福建电脑,2008,24(8):24-24.

同被引文献5

1Breunig M, Kriegel H P, Ng R, et al. LOF: Identifying Densitybased Local Outliers[C] //Proc. of ACM SIGMOD International Conference on Management of Data.[S. l.] : ACM Press, 2000.
2Tang Jian, Chen Zhixiang, Fu A W, et al. Enhancing Effectiveness of Outlier Detections for Low-density Patterns[C] //Proc. of the 6th Pacific-Asia Conference on Knowledge Discovery and Data Mining. Taipei, China:[s. n.] , 2002: 535-548.
3Sanjay C, Sun Pei. SLOM: A New Measure for Local Spatial Outliers[J]. Knowledge and Information Systems, 2006, 9(4): 412-429.
4凌妍妍,孟小峰,刘伟.基于属性相关度的Web数据库大小估算方法[J].软件学报,2008,19(2):224-236. 被引量：30
5王妍,潘瑜春,阎波杰.基于Voronoi和空间自相关的离群点检测[J].计算机工程,2010,36(1):33-34. 被引量：5

引证文献1

1向剑平,王悦,胡剑.基于道路网络的受限优化路径搜索算法[J].计算机工程,2011,37(12):53-55. 被引量：3

二级引证文献3

1邓定雄,关佶红.基于SPB树的公路网络最短路径查询[J].计算机工程,2011,37(22):56-58. 被引量：1
2向剑平,乔少杰,胡剑.基于不确定数据理论的道路相关度度量方法[J].计算机工程与设计,2012,33(6):2486-2490. 被引量：1
3唐炉亮,杨雪,刘章,王雪浩,靳晨,董坤.灾害条件下多层次应急疏散模型的构建方法研究[J].灾害学,2015,30(2):179-185. 被引量：3

1韩纪庆.基于最小分类错误准则的判别学习方法[J].电子工程师,2001,27(2):1-3. 被引量：2
2韩纪庆.一种语音识别中的环境自适应方法[J].计算机工程与应用,2002,38(1):69-70.
3郑伟,季铎,蔡东风,王爽.基于文本最小相似度的中心选取方法[J].广西师范大学学报（自然科学版）,2008,26(3):198-201. 被引量：3
4钱雪忠,孙华峰,贺庆和.关于Web服务动态组合的约束性满足的研究[J].沈阳工业大学学报,2007,29(3):326-329.
5王彦杰,刘峡壁,贾云得.一种视觉词软直方图的图像表示方法[J].软件学报,2012,23(7):1787-1795. 被引量：2
6武森,冯小东,杨杰,张晓楠.基于MapReduce的大规模文本聚类并行化[J].北京科技大学学报,2014,36(10):1411-1419. 被引量：9
7高妍方,王继伟.贝叶斯网络生成学习和判别学习对比研究[J].山东建筑大学学报,2013,28(4):328-334.
8王晓云,陈良生.旋转变化的人耳识别研究[J].计算机工程,2011,37(S1):208-210.
9王晖,孟祥萍,纪秀,赵传奇,霍雷.蚁群算法在威布尔分布模型参数估计中的应用[J].长春工程学院学报（自然科学版）,2014,15(3):116-119. 被引量：1
10王松,孙传庆,朱正平.基于GMM与改进MCE训练的说话人识别研究[J].自动化与仪器仪表,2010(6):21-23.

软件学报

2008年第3期

浏览历史

内容加载中请稍等...

基于最大-最小相似度学习方法的文本提取被引量：1

参考文献6

二级参考文献61

共引文献35

同被引文献5

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于最大-最小相似度学习方法的文本提取 被引量：1

参考文献6

二级参考文献61

共引文献35

同被引文献5

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于最大-最小相似度学习方法的文本提取被引量：1