-
题名印刷体朝鲜文字符中字母的分割与识别研究
被引量:2
- 1
-
-
作者
许日俊
刘昌平
-
机构
中国科学院自动化研究所文字识别实验室
-
出处
《中文信息学报》
CSCD
北大核心
2006年第2期66-71,共6页
-
基金
国家863计划资助项目(DH02H01)
-
文摘
朝鲜文是一种由元音和辅音构成的字母文字。因此经常使用的一种朝鲜文识别方法是:从朝鲜文字符中分离出每一个字母,然后对这些字母进行识别,最后确定识别字符。本文结合结构分析法,通过对字符图像背景进行细化处理,找到字母之间的分割线分离出了每个字母,并且利用两层外围距离特征对这些字母进行了识别。在对4种经常使用的朝鲜文印刷字体进行初步实验的结果表明,字母分割正确率平均达到了97.4%,而字母样本集识别率为99%以上。
-
关键词
人工智能
模式识别
字母分割
字母识别
朝鲜文字符识别
-
Keywords
artificial intelligence
pattern recognition
grapheme segmentation
grapheme recognition
Hangul character recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向手语信息处理的维吾尔文本采集的研究
被引量:1
- 2
-
-
作者
艾山江·亚生
阿里甫·库尔班
张丹丹
-
机构
新疆大学信息科学与工程学院
新疆大学软件学院
-
出处
《现代电子技术》
北大核心
2019年第12期136-139,143,共5页
-
基金
国家自然科学基金资助项目(61163029)
国家自然科学基金资助项目(61562084)~~
-
文摘
从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合成研究,为手语新闻文本编辑研究提供科学依据,对维吾尔文本进行自动分词、自动分句研究,并利用Word2Vec方法进一步建立文本词元库,通过这样保证训练语料的多元化及通用性。最后,利用词干提取方法以及分割字母的方式将维吾尔文本信息转换成手语文本信息,并在此基础上初步采集面向手语信息处理的维吾尔文本信息。实验表明该研究达到了预期目标。
-
关键词
深度学习
Word2Vec方法
手语合成
文本词元库
词干提取
字母分割
-
Keywords
deep learning
Word2Vec method
sign language synthesis
text word element library
word stem extraction
letter segmentation
-
分类号
TN912.34.34
[电子电信—通信与信息系统]
TP311.1
[自动化与计算机技术—计算机软件与理论]
-