基于小波分析及改进二次鉴别函数的民族文种识别被引量：2

Chinese minority script identification method based on wavelet feature and MQDF

下载PDF

导出

摘要为了能够对文档中的少数民族文字种类进行正确地识别分类,提出一种基于小波分析与改进的二次分类函数(MQDF)的少数民族文字种类识别方法。该方法采用多辨识小波分解,从而获得小波能量和小波能量比例分布的特征描述,利用MQDF分类器对少数民族文种进行识别。构建藏文、西双版纳傣文、纳西象形文、维吾尔文、德宏傣文和彝文6种常用的少数民族文字及汉字、英语共8种文字的样本库,采用该方法对少数民族的样本库进行了进行训练和测试。实验结果显示,该方法在多层小波分解的情况下,对于少数民族文种识别的精度好于传统的贝叶斯和KNN。 In order to classify the type of the Chinese minority scripts, the method of identifying the kinds of Chinese minority scripts based on wavelet analysis and Modified Quadratic Discriminant Function （MQDF） was presented. Using wavelet energy and wavelet energy distribution proportion as features by wavelet multi-resolution transform, muhivariate classifier in MQDF was constructed. A sample data set was built which contained six common Chinese minority scripts： Tibetan, Tai Lue, Naxi Pictographs, Uighur, Tai Le, Yi and Chinese and English in total, some samples were used for training, others were for testing, and the proportions of the training samples in dataset were variant. Obviously, the experimental result shows that, in muhi-level decomposition, the method is better than the traditional Bayes and K-Nearest Neighbor （KNN） classification in recognition rate.

作者郭海赵晶莹

机构地区大连民族学院计算机科学与工程学院

出处《计算机应用》 CSCD 北大核心 2009年第12期3360-3362,3365,共4页 journal of Computer Applications

基金国家自然科学基金资助项目(60803096) 国家民委项目(07DL07)

关键词中国少数民族文字文种识别小波分析改进的二次分类函数 Chinese minority script script identification wavelet analysis Modified Quadratic Discriminant Function （MQDF）

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1王维兰,丁晓青,祁坤钰.藏文识别中相似字丁的区分研究[J].中文信息学报,2002,16(4):60-65. 被引量：14
2王华,丁晓青,哈力木拉提.多字体多字号印刷维吾尔文字符识别[J].清华大学学报（自然科学版）,2004,44(7):946-949. 被引量：18
3李振宏,高光来,侯宏旭,李伟.印刷体蒙古文文字识别的研究[J].内蒙古大学学报（自然科学版）,2003,34(4):454-457. 被引量：9
4GUO HAI, ZHAO JING-YING. The design and realization of the Naxi pictographs information processing system [J]. WSEAS Transactions on Systems, 2009, 6(2) : 302 -311.
5郭海,车文刚,聂娟,李斌,许剑锋.纳西象形文Web植入技术[J].计算机工程,2005,31(17):203-204. 被引量：8
6GUO HAI, ZHAO JING-YING, LIU YONG-KUI, et al. Naxi pictographs information processing based on Web embedding fonts technology [ J]. Journal of Computational Information Systems, 2009, 5 (1) :495 -501.
7HOCHBERG J, KELLY P, THOMAS T, et al. Automatic script identification from document images using cluster-based templates [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(2): 176-181.
8SUEN C Y, BERGLER S, NOBILE N, et al. Automatic identification of oriental and other scripts in image documents [ J]. Intemational Journal of Computer Processing of Oriental Languages, 2005, 18(2): 77-94.
9PATI P B, RAMAKRISHNAN A G. Word level multi-script identification [ J]. Pattern Recognition Letters, 2008, 29(9) : 1218 - 1229.
10张振宇,黄崇林,谭恒松.基于小波变换的图像识别算法[J].计算机应用,2007,27(B12):97-99. 被引量：6

二级参考文献26

1陈友斌.非特定人脱机手写汉字识别方法的研究.清华大学电子系博士学位论文[M].,1997(6).56-63.
2Al-Badr B, Mahmoud A. Survey and bibliography of Arabic optical text recognition [J]. Signal Processing, 1995, 41(1): 49-77.
3Al-Yousefi H, Udpa S. Recognition of Arabic characters [J]. IEEE Trans on PAMI, 1992, 14(8): 853-858.
4Hou H, Andrews H. Cubic splines for image interpolation and digital filtering [J]. IEEE Trans on Acoustics, Speech, and Signal Processing, 1978, 26(6): 508-517.
5Fukunaga K. Introduction to Statistical Pattern Recognition (2nd Edition) [M]. New York: Academic Press, 1990.
6Kimura F, Takashina K, Tsuruoka S. Modified quadratic discriminant functions and the application to Chinese character recognition [J]. IEEE Trans on PAMI, 1987, 9(1): 149-153.
7LIN Xiaofan, DING Xiaoqing, CHEN Ming, et al. Adaptive confidence transform based classifier combination for Chinese character recognition [J]. Pattern Recognition Letters, 1998, 19(10): 975-988.
8Kato N, Suzuki M, Omachi S, et al. A handwritten character recognition system using directional element feature and asymmetric Mahalanobis distance [J]. IEEE Trans on PAMI, 1999, 21(3): 258-262.
9马少平,夏莹,朱小燕.基于模糊方向线素特征的手写体汉字识别[J].清华大学学报（自然科学版）,1997,37(3):42-45. 被引量：37
10Microsoft. TrueType Open Font Specification. 1995-07.

共引文献44

1柳洪轶,王晓东,王维兰.藏文联机手写识别的难点及其解决方法[J].西北民族大学学报（自然科学版）,2005,26(1):77-80. 被引量：3
2郭海,赵晶莹.纳西象形文字信息处理平台的开发[J].微计算机信息,2006(08S):221-223. 被引量：3
3柳洪轶,王维兰.联机手写藏文识别中字丁规范化处理[J].计算机应用研究,2006,23(9):179-181. 被引量：6
4王嘉梅,文永华,李燕青,高雅莉.基于图像分割的古彝文字识别系统研究[J].云南民族大学学报（自然科学版）,2008,17(1):76-79. 被引量：10
5达吾勒.阿布都哈依尔,古丽拉.阿东别克.基于ANN的哈萨克文手写文字识别系统的研究[J].计算机工程与应用,2008,44(1):225-228. 被引量：6
6郭海,高金山,赵晶莹.纳西象形文拉丁拼音输入方案设计及实现[J].计算机应用与软件,2009,26(5):50-52. 被引量：1
7高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报（社会科学版）,2009,24(3):18-27. 被引量：15
8包艳花.蒙古文识别文本后处理字素合并模块的实现[J].内蒙古民族大学学报,2009,15(6):14-15.
9郭海,赵晶莹,苏飞.基于小波分析及KNN的民族文字分类方法[J].微电子学与计算机,2010,27(2):107-110. 被引量：1
10郭海,赵晶莹.纳西图形文图元输入法[J].计算机工程,2010,36(4):289-290. 被引量：2

同被引文献25

1刘赛,李益东.彝文文字识别中的文字切分算法设计与实现[J].中南民族大学学报（自然科学版）,2007,26(3):70-72. 被引量：14
2王华,丁晓青,哈力木拉提.多字体多字号印刷维吾尔文字符识别[J].清华大学学报（自然科学版）,2004,44(7):946-949. 被引量：18
3赵骥,王丽君,李晶皎.基于统计的满文识别后处理的研究和实现[J].鞍山科技大学学报,2005,28(6):444-446. 被引量：1
4吴刚,德熙嘉措,黄鹤鸣.印刷体藏文识别技术[J].青海师范大学学报（自然科学版）,2006,22(1):32-37. 被引量：7
5魏宏喜,高光来.印刷体蒙古文字识别中蒙古文字特征的选择[J].内蒙古大学学报（自然科学版）,2006,37(6):694-697. 被引量：8
6张广渊,李晶皎,王爱侠.脱机手写满文笔画基元的提取和识别[J].计算机工程,2007,33(22):200-202. 被引量：6
7Hochberg J,Bowers K,Cannon M. Script and language identification for handwritten docu-ment image[J].{H}INTERNATIONAL JOURNAL ON DOCUMENT ANALYSIS AND RECOGNITION,1999.45-52.
8Chaudhury S,Sheth R. Trainable script identifica-tion strategies for indian languages[A].1999.657-660.
9Dhanya D,Ramakrishnan A G,Pati P B. Script i-dentification in printed bilingual documents[J].Sadhana,2002,(01):73-82.
10Pati P B,Raju S S,Pati N K. HVS inspired system for script identification in indian multi-script documents[A].2006.380-389.

引证文献2

1金璟璇,崔荣一,崔旭.基于小波统计特征的行块级朝汉文种辨识[J].延边大学学报（自然科学版）,2013,39(4):277-280. 被引量：2
2周兴华,李敏,郑蕊蕊,许爽,胡艳霞.印刷体满文文字数据库的构建与实现[J].大连民族学院学报,2015,17(3):270-273. 被引量：4

二级引证文献6

1王帆,李敏,丁纪峰,许爽,郑蕊蕊.手写满文字母采集系统的设计与实现[J].大连民族大学学报,2016,18(5):513-516. 被引量：2
2张鹏,崔荣一.基于基本图像特征的中朝文种辨识方法[J].延边大学学报（自然科学版）,2017,43(2):173-178.
3谷宁馨,王帆,李敏.嵌入式手写满文单词录入系统设计与实现[J].智能计算机与应用,2017,7(4):121-123.
4毕佳晶,李敏,郑蕊蕊,许爽,贺建军,黄荻.面向满文字符识别的训练数据增广方法研究[J].大连民族大学学报,2018,20(1):73-78. 被引量：7
5付玉,王帆.嵌入式手写满文信息查询系统电路设计与实现[J].信息技术与信息化,2017(4):61-64. 被引量：2
6李顺,木特力铺.马木提,吾尔尼沙.买买提,阿力木江.艾沙,库尔班.吾布力.基于离散曲波变换的多文种文档图像文种识别[J].计算机工程与设计,2019,40(5):1376-1382. 被引量：4

1郭海,赵晶莹,韦宗伟.一种采用小波包分析及RBFN的民族文种识别方法[J].计算机工程与科学,2010,32(8):78-80. 被引量：1
2陆小川,伊兵哲,平西建,程娟.含噪文本图像的中英文文种识别研究[J].计算机工程与设计,2007,28(21):5150-5152. 被引量：3
3付强,丁晓青,刘长松.用于手写汉字识别的级联MQDF分类器[J].清华大学学报（自然科学版）,2008,48(10):1609-1612. 被引量：6
4金璟璇,崔荣一,崔旭.基于小波统计特征的行块级朝汉文种辨识[J].延边大学学报（自然科学版）,2013,39(4):277-280. 被引量：2
5郭海,赵晶莹,苏飞.基于小波分析及KNN的民族文字分类方法[J].微电子学与计算机,2010,27(2):107-110. 被引量：1
6陈睿,龚招友.基于文档图像的中英文文种识别[J].电信技术研究,2005(5):25-28.
7顾立娟,刘才斌,吴勇,郝玉保.基于多小波变换的文本图像文种识别[J].电子设计工程,2011,19(15):152-155. 被引量：1
8郭龙,平西建,周林,童莉.基本图像特征用于文本图像文种识别[J].应用科学学报,2011,29(1):56-60. 被引量：4
9吴长生,席建民,罗代升.基于小波纹理的文种改进算法[J].中国测试技术,2005,31(3):14-16.
10姜铮铟,丁晓青.基于MQDF的英文OCR多模板分类器[J].计算机工程,2005,31(15):56-58. 被引量：4

计算机应用

2009年第12期

浏览历史

内容加载中请稍等...

基于小波分析及改进二次鉴别函数的民族文种识别被引量：2

参考文献10

二级参考文献26

共引文献44

同被引文献25

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于小波分析及改进二次鉴别函数的民族文种识别 被引量：2

参考文献10

二级参考文献26

共引文献44

同被引文献25

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于小波分析及改进二次鉴别函数的民族文种识别被引量：2