基于LTP和HOG纹理特征融合的中亚文档图像文种识别被引量：3

Script identification of Central Asian document images based on LTP and HOG texture feature fusion

导出

摘要针对中亚地区存在一些相似度较高的文种,提出一种基于具有旋转不变性的统一局部三值模式(rotation invariant uniform local ternary pattern, riu2-LTP)和方向梯度直方图(histogram of oriented gradients, HOG)特征交叉融合的文档图像文种方法。使用SVM分类器对包含10个文种共10 000张图片的数据库进行试验;为了提高多文种识别效果,采用贝叶斯优化SVM的超参数。对文档图像提取了半径为1,采样点为8的riu2-LTP;重新对数据库提取HOG;采用交叉融合方法将20维riu2-LTP特征与36维HOG特征分别依次融入到新的特征集。试验表明,本研究方法平均查准率达到99%,相较于单一LTP、riu2-LTP和HOG方法有更好性能。 Due to the existence of a number of scripts with high similarity in Central Asia, a document image script identification method based on the cross-fusion of a unified local ternary pattern(riu2-LTP) with rotational invariance and histogram of oriented gradients(HOG) features was proposed. An SVM classifier was used to perform experiments on a database containing a total of 10 000 images of 10 scripts. In order to improve multi-script identification, Bayesian optimized SVM hyperparameters were used. The method first extracted riu2-LTP with a radius of and a sampling 8 points for the document images;HOG was extracted from the database again;the cross-fusion method was to incorporate the 20-dimensional riu2-LTP features and 36-dimensional HOG features sequentially into the new feature set, respectively. The experiments showed that the average recognition rate of this method reached 99%, which was better than the single LTP, riu2-LTP, and HOG methods.

作者吴正健木特力甫·马木提吾尔尼沙·买买提阿力木江·艾沙库尔班·吾布力 WU Zhengjian;MUTALLIP Mamut;HORNISA Mamat;ALIM Aysa;KURBAN Ubu(School of Information Science Engineering,Xinjiang University,Urumqi 830046,Xinjiang,China;The Library,Xinjiang University,Urumqi 830046,Xinjang,China;The Key Lab.of Xinjiang Mutilingual Information Technology,Urumqi 830046,Xinjiang,China)

机构地区新疆大学信息科学与工程学院新疆大学图书馆新疆多语种信息技术重点实验室

出处《山东大学学报（工学版）》 CAS CSCD 北大核心 2021年第2期115-121,共7页 Journal of Shandong University（Engineering Science）

基金国家自然科学基金资助项目(61862061,6161563052,61363064) 新疆大学博士科研启动基金项目(BS180268) 新疆维吾尔自治区高校科研计划创新团队基金项目(XJEDU2017T002)。

关键词 LTP HOG 特征融合贝叶斯优化文种识别 LTP HOG feature fusion Bayesian optimization script identification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1王刚,靳彦青,刘立柱,储瑞来.基于多特征融合的东亚文种识别[J].计算机科学,2013,40(1):273-276. 被引量：4
2童莉,周林,平西建,徐森.基于高斯衍生滤波器组的文种识别算法[J].数据采集与处理,2014,29(5):713-719. 被引量：5
3买买提依明.哈斯木,吾守尔.斯拉木,维尼拉.木沙江,努尔麦麦提.尤鲁瓦斯.基于统计专用字符的维、哈、柯文文种识别研究[J].中文信息学报,2015,29(2):111-117. 被引量：5
4布阿加姑丽.米吉提,库尔班.吾布力,努尔毕亚.亚地卡尔,吐尔根.依不拉因,阿力木江.艾沙.纹理特征加权融合的中亚多文种文档图像文种识别[J].计算机工程与应用,2017,53(20):187-194. 被引量：4
5李顺,木特力铺.马木提,吾尔尼沙.买买提,阿力木江.艾沙,库尔班.吾布力.基于离散曲波变换的多文种文档图像文种识别[J].计算机工程与设计,2019,40(5):1376-1382. 被引量：4

二级参考文献46

1维尼拉.木沙江,吐尔地.托合提,吐尔洪.吾司曼.基于重定位的维、哈、柯文Unicode编码及多文种索引技术研究[J].郑州大学学报（理学版）,2009,41(1):48-49. 被引量：2
2陆小川,伊兵哲,平西建,程娟.含噪文本图像的中英文文种识别研究[J].计算机工程与设计,2007,28(21):5150-5152. 被引量：3
3Spitz A L.Determination of the script and language content of document images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(3):235-245.
4Pal U,Chaudhuri B B.Identification of different script lines from multi-script documents[J].Image and Vision Computing,2002,20..945-954.
5Elgammal A M,Ismail M A.Techniques for language identification for hybrid arabic-english document images[C]// Proc of 6th International Conference on Document Analysis and Recognition.Seattle,USA:IEEE Computer Society,2001:1100-1104.
6Hochberg J,Kelly P,Thomas T.Automatic script identification from images using cluster-based templates[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(2):176-181.
7Nakayama T,Spitz A L.European language determination from image[C]// Proc of the International Conference on Document Analysis and Recognition.Tsukuba,Japan:IEEE Computer Society,1993:159-162.
8Busch A,Boles W W,Sridharan S.Texture for script identification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(11):1720-1732.
9Tan T N.Rotation invariant texture features and their use in automatic script identification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(7):751-756.
10Padma M C,Vijaya P A.Entropy based texture features useful for automatic script identification[J].International Journal on Computer Science and Engineering,2010,2(2):115-120.

共引文献12

1孙挺,张锦华,耿国华.基于局部特征概率密度估计的三维模型特征提取方法[J].计算机科学,2015,42(6):293-295. 被引量：4
2刘旭.双向文本元素在SVG中的显示技术[J].计算机系统应用,2017,26(4):246-251. 被引量：2
3黄寅.基于软件工程与叠层深度学习的工件文本识别算法[J].宝鸡文理学院学报（自然科学版）,2018,38(1):48-51. 被引量：1
4布阿加姑丽.米吉提,库尔班.吾布力,努尔毕亚.亚地卡尔,吐尔根.依不拉因,阿力木江.艾沙.纹理特征加权融合的中亚多文种文档图像文种识别[J].计算机工程与应用,2017,53(20):187-194. 被引量：4
5韩兴坤,阿力木江.艾沙,努尔毕亚.亚地卡尔,朱亚俐,库尔班.吾布力.NSCT子带纹理特征融合的中亚文种识别[J].计算机工程与设计,2018,39(9):2848-2855. 被引量：1
6何峻青,黄娴,赵学敏,张克亮.利用领域外数据对口语风格短文本的相近语种识别研究[J].中文信息学报,2019,33(3):71-78. 被引量：3
7李顺,木特力铺.马木提,吾尔尼沙.买买提,阿力木江.艾沙,库尔班.吾布力.基于离散曲波变换的多文种文档图像文种识别[J].计算机工程与设计,2019,40(5):1376-1382. 被引量：4
8热依汗古丽·卡森木,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于Ridgelet变换的多文种文档图像文种识别[J].计算机工程与设计,2020,41(11):3137-3142.
9陈波,鄢爱兰.改进型多项式匹配图像去噪算法的研究与应用[J].电子测量与仪器学报,2021,35(4):177-186. 被引量：8
10熊黎剑,吾守尔·斯拉木,许苗苗.基于Django印刷体维吾尔文识别系统的设计与实现[J].郑州大学学报（理学版）,2021,53(3):9-14. 被引量：2

同被引文献37

1胡庆新,吕鹏.基于多特征融合的红外图像行人检测[J].计算机应用,2016,36(A01):157-160. 被引量：7
2吴益红,许钢,江娟娟,毕运锋.一种用于工件识别的LBP-HOG特征融合方法[J].南阳师范学院学报,2016,15(9):33-38. 被引量：5
3闫敬文,江志东,刘蕾.基于HOG-多尺度LBP特征的人脸性别识别[J].扬州大学学报（自然科学版）,2016,19(3):58-62. 被引量：7
4高聪,王福龙.基于模板匹配和局部HOG特征的车牌识别算法[J].计算机系统应用,2017,26(1):122-128. 被引量：34
5吴敬学.基于粒子群优化的KNN分类算法改进研究[J].顺德职业技术学院学报,2017,15(4):5-8. 被引量：2
6张苗辉,易均,钱赛,郑萍,唐超,胡春玲.基于LBP特征的人体行为识别算法研究[J].江西科学,2017,35(6):940-946. 被引量：2
7范支菊,张公敬,杨嘉东.基于密度裁剪的SVM分类算法[J].青岛大学学报（自然科学版）,2018,31(3):46-51. 被引量：2
8凌翔,赖锟,王昔鹏.基于模板匹配方法的不均匀照度车牌图像识别[J].重庆交通大学学报（自然科学版）,2018,37(8):102-106. 被引量：23
9梁师哲,梁京章,梁成国.优化PSO-BP算法及其在校园网安全日志分类上的应用[J].网络安全技术与应用,2018(9):57-59. 被引量：2
10汪宇玲,黎明.圆迹变换及图像纹理分析[J].电子学报,2018,46(10):2351-2358. 被引量：3

引证文献3

1郑琳,王福龙.改进HOG特征的车牌识别算法[J].软件导刊,2022,21(5):193-197. 被引量：4
2于晓,李朝.基于多特征融合的红外图像分类研究[J].红外,2022,43(10):32-42.
3常玉祥,汪宇玲,陈立.基于BoF和迹变换多特征融合的图像纹理分类研究[J].现代电子技术,2023,46(11):43-50. 被引量：1

二级引证文献5

1包艳艳,张雨烟,赵婷.图像处理技术在银行卡识别中的应用[J].长江信息通信,2022,35(8):119-121.
2齐天翔.基于HOG特征提取的预算绩效系统设计[J].自动化与仪器仪表,2022(12):153-156.
3李冰冰,朱格,曹晗,李峰,潘雨青.基于图像分类的多类型数字仪表自动读取方法[J].软件,2023,44(12):70-75.
4王忠丰,范宝国.基于多尺度半耦合卷积稀疏编码的遥感地貌影像纹理识别方法[J].计算机测量与控制,2024,32(10):284-290.
5洪顺贺,胡宸滔,铁治欣,丁成富.一种改进卷积循环神经网络的复杂场景下的车牌识别模型[J].建模与仿真,2023,12(3):2498-2504.

1热依汗古丽·卡森木,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于Ridgelet变换的多文种文档图像文种识别[J].计算机工程与设计,2020,41(11):3137-3142.
2陆莉霞,邹俊忠,郭玉成,张见,王蓓.多模态融合的膝关节损伤预测[J].计算机工程与应用,2021,57(9):225-232. 被引量：10
3刘征,李喜艳,孙汉卿,连卫民,王桂芝.基于信息预处理的PPVO可逆信息隐藏算法[J].郑州大学学报（理学版）,2021,53(2):50-56.
4尹宽,李均利,胡凯,李丽.融入时序和速度信息的自适应更新目标跟踪[J].中国图象图形学报,2021,26(4):883-897. 被引量：2

山东大学学报（工学版）

2021年第2期

浏览历史

内容加载中请稍等...

基于LTP和HOG纹理特征融合的中亚文档图像文种识别被引量：3

参考文献5

二级参考文献46

共引文献12

同被引文献37

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于LTP和HOG纹理特征融合的中亚文档图像文种识别 被引量：3

参考文献5

二级参考文献46

共引文献12

同被引文献37

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于LTP和HOG纹理特征融合的中亚文档图像文种识别被引量：3