NSCT子带纹理特征融合的中亚文种识别被引量：1

Script identification of central Asian based on fusion texture feature of NSCT sub-bands

下载PDF

导出

摘要由于中亚地区某些文种相似度较高,单一纹理特征不能充分描述它们的纹理特点。为此,提出基于NSCT子带纹理特征融合的文种识别方法,即先对预处理后的文档图像进行非下采样Contourlet变换。对变换产生的子带分别提取局部二值模式和灰度共生矩阵特征,生成高维融合特征向量,通过主成分分析法对其进行降维生成低维特征向量。通过对阿拉伯文、俄文、藏文、中文、维吾尔文、英文、蒙古文、吉尔吉斯斯坦文、哈萨克斯坦文、土耳其文进行实验,验证了该方法能更准确地提取文档图像多尺度、多方向的纹理特征,有效提高识别率。 Due to the higher similarity of some scripts in Central Asia,a single texture feature can not adequately describe their texture feature.To solve this problem,a script-identification method based on fusion texture feature of nonsubsampled Contourlet transform sub-bands was proposed.The preprocessed document images were subjected to nonsubsampled Contourlet transform firstly.The local binary patterns and the gray level co-occurrence matrix features were extracted from the sub-bands gene rated by the transformation,and the high-dimensional fusion feature vector was generated.The principal component analysis was used to reduce dimension to generate low-dimensional feature vectors.Experiments on Arabic,Russian,Tibetan,Chinese,Uyghur,English,Mongolian,Kyrgyzstan,Kazakhstan,and Turkish verify that the proposed method can more accurately extract the multi-scale and multi-directional texture features of document images,and can improve the recognition rate effectively.

作者韩兴坤阿力木江.艾沙努尔毕亚.亚地卡尔朱亚俐库尔班.吾布力 HAN Xing-kun;Alimjan Aysa;Nurbiya Yadikar;ZHU Ya-li;Kurban Ubul(School of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;Network and Information Center,Xinjiang University,Urumqi 830046,China)

机构地区新疆大学信息科学与工程学院新疆大学网络与信息中心

出处《计算机工程与设计》北大核心 2018年第9期2848-2855,共8页 Computer Engineering and Design

基金国家自然科学基金项目(61363064 61563052 61163028) 新疆大学博士科研启动基金项目(BS150262)

关键词文种识别融合纹理特征非下采样CONTOURLET变换局部二值模式灰度共生矩阵支持向量机 script identification fusion texture features nonsubsampled Contourlet transform local binary patterns gray level co-occurrence matrix support vector machine

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1童莉,周林,平西建,徐森.基于高斯衍生滤波器组的文种识别算法[J].数据采集与处理,2014,29(5):713-719. 被引量：5
2孟令军,文波,张晓春,韩朝辉.打印文稿识别技术研究与设计[J].科学技术与工程,2015,35(14):185-190. 被引量：2

二级参考文献34

1刘宁,裴雷.彩色激光打印机、复印机同一认定新方法[J].江苏警官学院学报,2005,20(2):165-170. 被引量：20
2Spitz A L.Determination of the script and language content of document images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(3):235-245.
3Pal U,Chaudhuri B B.Identification of different script lines from multi-script documents[J].Image and Vision Computing,2002,20..945-954.
4Elgammal A M,Ismail M A.Techniques for language identification for hybrid arabic-english document images[C]// Proc of 6th International Conference on Document Analysis and Recognition.Seattle,USA:IEEE Computer Society,2001:1100-1104.
5Hochberg J,Kelly P,Thomas T.Automatic script identification from images using cluster-based templates[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(2):176-181.
6Nakayama T,Spitz A L.European language determination from image[C]// Proc of the International Conference on Document Analysis and Recognition.Tsukuba,Japan:IEEE Computer Society,1993:159-162.
7Busch A,Boles W W,Sridharan S.Texture for script identification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(11):1720-1732.
8Tan T N.Rotation invariant texture features and their use in automatic script identification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(7):751-756.
9Padma M C,Vijaya P A.Entropy based texture features useful for automatic script identification[J].International Journal on Computer Science and Engineering,2010,2(2):115-120.
10Hiremath P S,Shivashankar S.Wavelet based co-occurrence histogram features for texture classification with an application to script identification in a document images[J].Pattern Recognition Letters,2008,29(9):1182-1189.

共引文献5

1黄寅.基于软件工程与叠层深度学习的工件文本识别算法[J].宝鸡文理学院学报（自然科学版）,2018,38(1):48-51. 被引量：1
2布阿加姑丽.米吉提,库尔班.吾布力,努尔毕亚.亚地卡尔,吐尔根.依不拉因,阿力木江.艾沙.纹理特征加权融合的中亚多文种文档图像文种识别[J].计算机工程与应用,2017,53(20):187-194. 被引量：4
3李顺,木特力铺.马木提,吾尔尼沙.买买提,阿力木江.艾沙,库尔班.吾布力.基于离散曲波变换的多文种文档图像文种识别[J].计算机工程与设计,2019,40(5):1376-1382. 被引量：4
4吴正健,木特力甫·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于LTP和HOG纹理特征融合的中亚文档图像文种识别[J].山东大学学报（工学版）,2021,51(2):115-121. 被引量：3
5曾俊轩,郭丽娜.河道砂石运输自动监管系统设计与实现[J].人民长江,2024,55(S01):265-268. 被引量：1

同被引文献11

1于海燕.基于小波和脊波变换的探地雷达信号杂波抑制[J].电子科技,2015,28(7):1-4. 被引量：5
2强彦,张晓慧.车载手势识别中基于小波变换和双边滤波的图像去噪方法[J].北京理工大学学报,2017,37(4):376-380. 被引量：15
3黄贤英,熊李媛,刘英涛,李沁东.基于类别特征改进的KNN短文本分类算法[J].计算机工程与科学,2018,40(1):148-154. 被引量：23
4布阿加姑丽.米吉提,库尔班.吾布力,努尔毕亚.亚地卡尔,吐尔根.依不拉因,阿力木江.艾沙.纹理特征加权融合的中亚多文种文档图像文种识别[J].计算机工程与应用,2017,53(20):187-194. 被引量：4
5李顺,木特力铺.马木提,吾尔尼沙.买买提,阿力木江.艾沙,库尔班.吾布力.基于离散曲波变换的多文种文档图像文种识别[J].计算机工程与设计,2019,40(5):1376-1382. 被引量：4
6李琛,王延杰,梁梦媞.结合CS-LBP和DBN的非受控人脸识别[J].计算机工程与设计,2019,40(5):1430-1434. 被引量：2
7程磊,高茂庭.结合时间加权和LDA聚类的混合推荐算法[J].计算机工程与应用,2019,55(11):160-166. 被引量：31
8白灵鸽,段先华.改进的LBP算法在图像检索中的应用[J].计算机工程与设计,2019,40(6):1671-1675. 被引量：6
9钟熙,孙祥娥.基于Kmeans++聚类的朴素贝叶斯集成方法研究[J].计算机科学,2019,46(B06):439-441. 被引量：26
10张阳峰,韦仕鸿,邓娜娜,王文瑞.基于小波降噪的振动传感器数据分析[J].计算机科学,2019,46(B06):537-539. 被引量：17

引证文献1

1热依汗古丽·卡森木,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于Ridgelet变换的多文种文档图像文种识别[J].计算机工程与设计,2020,41(11):3137-3142.

1布阿加姑丽.米吉提,库尔班.吾布力,努尔毕亚.亚地卡尔,吐尔根.依不拉因,阿力木江.艾沙.纹理特征加权融合的中亚多文种文档图像文种识别[J].计算机工程与应用,2017,53(20):187-194. 被引量：4
2王华彬,李梦雯,周健,陶亮.基于双Gabor方向韦伯局部描述子的掌纹识别[J].电子与信息学报,2018,40(4):936-943. 被引量：5
3闵信军,林庆,朱玉全.基于图像分块处理的灰度共生矩阵瑕疵检测[J].信息技术,2018,42(5):90-93. 被引量：2
4贾伟,闫颖盈,温川飙,吴纯洁,王谦,赵姝婷,陈菊,施明毅,谭超群.中药饮片切面纹理特征提取研究[J].成都中医药大学学报,2017,40(4):1-6. 被引量：11
5丁玖乐,邢兆宇,陈真,俞胜男,孙军,陈杰,邱建国,邢伟.CT纹理分析术前预测肾脏透明细胞癌Fuhrman分级的价值[J].中华放射学杂志,2018,52(8):614-618. 被引量：15
6丁玖乐,陈蕾,孙玲玲,田小娟,陈杰,邢伟.VX2瘤在不同CT机型下常规腹部扫描的纹理分析差异及预处理评价[J].中国医学影像学杂志,2018,26(1):7-10. 被引量：3

计算机工程与设计

2018年第9期

浏览历史

内容加载中请稍等...

NSCT子带纹理特征融合的中亚文种识别被引量：1

参考文献2

二级参考文献34

共引文献5

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

NSCT子带纹理特征融合的中亚文种识别 被引量：1

参考文献2

二级参考文献34

共引文献5

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

NSCT子带纹理特征融合的中亚文种识别被引量：1