期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
印刷体现代藏文识别研究 被引量:22
1
作者 王维兰 丁晓青 +1 位作者 陈力 王华 《计算机工程》 CAS CSCD 北大核心 2003年第3期37-38,94,共3页
以印刷体现代藏文白体、黑体、圆体、长体、竹体为字体样张,通过预处理、文 本行字切分、特征选择和分类识别的初步研究,获得对5种字体文本的平均识别率为89.582 % ,对其他字体的文本平均识别率为93.867%。
关键词 印刷体藏文 预处理 特征选择 分类识别 模式识别 藏文识别
下载PDF
藏文识别的预处理 被引量:19
2
作者 王浩军 赵南元 邓钢轶 《计算机工程》 CAS CSCD 北大核心 2001年第9期93-96,共4页
预处理是整个文字识别系统的重要组成部分,预处理性能的优劣将直接影响整个识别系统的性能。根据藏文在字形和书写方式上的特点,实现了一种适用于藏文识别的预处理技术,整个预处理过程包括二值化、版面分析、倾斜校正、字符切分和归... 预处理是整个文字识别系统的重要组成部分,预处理性能的优劣将直接影响整个识别系统的性能。根据藏文在字形和书写方式上的特点,实现了一种适用于藏文识别的预处理技术,整个预处理过程包括二值化、版面分析、倾斜校正、字符切分和归一化。在预处理过程中还提取了一些有关字丁的基本特征,这些特征充分反映了藏文的特点,具有良好的稳定性,可以用于识别系统的粗分类和后处理。 展开更多
关键词 藏文识别 预处理 字符切分 文字识别系统 计算机
下载PDF
藏文识别中相似字丁的区分研究 被引量:14
3
作者 王维兰 丁晓青 祁坤钰 《中文信息学报》 CSCD 北大核心 2002年第4期60-65,共6页
相似字丁多是藏文识别中的一大难点。本文通过对相似字丁类型的研究 ,以及印刷体藏文识别结果的统计分析 ,得到图形结构的分析与识别结果相吻合的结论。说明必须根据藏文字丁的结构特点 ,在字符归一化、特征选择方面进行特殊的处理 ,以... 相似字丁多是藏文识别中的一大难点。本文通过对相似字丁类型的研究 ,以及印刷体藏文识别结果的统计分析 ,得到图形结构的分析与识别结果相吻合的结论。说明必须根据藏文字丁的结构特点 ,在字符归一化、特征选择方面进行特殊的处理 ,以实现藏文识别中相似字丁的区分。 展开更多
关键词 区分研究 藏文识别 相似字丁 归一化 特征选择 字符图形 相似形
下载PDF
联机手写藏文识别中字丁规范化处理 被引量:6
4
作者 柳洪轶 王维兰 《计算机应用研究》 CSCD 北大核心 2006年第9期179-181,共3页
通过对几种规范化处理算法的深入研究,根据联机手写藏文字丁的特点进行规范化处理,揭示出不同算法的内在本质规律;同时对联机手写藏文识别中的各种噪声进行分析,使用相应的方法消除噪声。使联机手写藏文识别系统的识别率得到一定的提高。
关键词 联机手写藏文识别 噪声 规范化
下载PDF
基于笔划特征和MCLRNN模型的联机手写藏文识别 被引量:6
5
作者 王维兰 陈万军 《计算机工程与应用》 CSCD 北大核心 2008年第14期91-93,194,共4页
提出了一种新的多层联系子层递归神经网络(MCLRNN)模型并融合藏文字丁的空间结构特征来进行联机手写藏文识别。改进后的网络结构具有多层联系子层来保留若干时刻的网络内部状态,从而可以更好地表征藏文字的各笔划特征以及笔划间的空间... 提出了一种新的多层联系子层递归神经网络(MCLRNN)模型并融合藏文字丁的空间结构特征来进行联机手写藏文识别。改进后的网络结构具有多层联系子层来保留若干时刻的网络内部状态,从而可以更好地表征藏文字的各笔划特征以及笔划间的空间结构关系,同时,采用更适用于模式分类的交叉熵准则和改进的梯度下降算法来训练网络,加快了网络的收敛速度并增强其分类能力。仿真实验取得了令人满意的结果。 展开更多
关键词 递归神经网络 联机手写藏文识别 交叉熵
下载PDF
基于HMM的分类器在联机手写藏文识别中的应用 被引量:3
6
作者 梁弼 王维兰 钱建军 《微电子学与计算机》 CSCD 北大核心 2009年第4期98-101,104,共5页
为了解决联机手写藏文识别中藏文的曲线型笔划比较多,连笔情况很普遍以及相似字丁多等问题,提出了一种新的联机手写藏文识别方法:基于HMM分类器的联机手写藏文识别的方法.设计了三种不同的HMM分类器进行藏文字丁识别,实验结果表明,基于... 为了解决联机手写藏文识别中藏文的曲线型笔划比较多,连笔情况很普遍以及相似字丁多等问题,提出了一种新的联机手写藏文识别方法:基于HMM分类器的联机手写藏文识别的方法.设计了三种不同的HMM分类器进行藏文字丁识别,实验结果表明,基于HMM分类器的联机手写藏文识别具有较高地识别率,前十位识别率可达93.9012%. 展开更多
关键词 联机手写藏文识别 隐马尔可夫模型 HMM分类器 识别
下载PDF
藏文识别后处理研究 被引量:10
7
作者 王维兰 丁晓青 戴玉刚 《术语标准化与信息技术》 2002年第2期30-34,共5页
介绍了基于统计的Markov模型和藏文音节拼写规则的方法用于藏文识别后处理所获得了一些实验结果;针对藏文的特点,提出了继续深入研究的内容。
关键词 后处理 MARKOV模型 藏文识别 文本识别
下载PDF
基于规则的藏文识别后处理研究 被引量:4
8
作者 祁坤钰 《西北民族大学学报(自然科学版)》 2003年第4期33-36,共4页
基于藏文音节规则的识别后处理方法,总结了音节规则的约束条件 试验表明该方法在藏文文本识别后处理中具有较高的自适应性 在《印刷藏文(汉英混排)文档识别系统》的测试中,50万字的藏文测试样本,识别率在97.3%的基础上提高了0.3%。
关键词 藏文识别 识别后处理 音节规则 算法
下载PDF
印刷体藏文识别技术 被引量:7
9
作者 吴刚 德熙嘉措 黄鹤鸣 《青海师范大学学报(自然科学版)》 2006年第1期32-37,共6页
藏文字符识别是中国的多文种信息处理系统的重要组成部分,本文论述了印刷体藏文识别系统的原理和预处理、识别、后处理过程,分析了文字识别的常用方法及其优缺点和印刷体藏文识别技术,着重分析了印刷体藏文识别中特征提取和分类器设计... 藏文字符识别是中国的多文种信息处理系统的重要组成部分,本文论述了印刷体藏文识别系统的原理和预处理、识别、后处理过程,分析了文字识别的常用方法及其优缺点和印刷体藏文识别技术,着重分析了印刷体藏文识别中特征提取和分类器设计这两个关键技术,并对藏文识别研究领域今后的研究方向和发展前景提出了自己的看法. 展开更多
关键词 藏文信息技术 模式识别 印刷体藏文识别 方向线素
下载PDF
基于深度学习的自然场景藏文识别研究 被引量:9
10
作者 仁青东主 尼玛扎西 《高原科学研究》 CSCD 2019年第4期96-103,共8页
自然场景文字识别已成为计算机视觉领域中的重要研究领域,但是当前大多数技术方法都集中在中文和英文的识别上,对于自然场景中的藏文识别研究少之又少。文章针对自然场景中的复杂图像质量、文字粘连的识别问题,提出了一种符合藏文的卷... 自然场景文字识别已成为计算机视觉领域中的重要研究领域,但是当前大多数技术方法都集中在中文和英文的识别上,对于自然场景中的藏文识别研究少之又少。文章针对自然场景中的复杂图像质量、文字粘连的识别问题,提出了一种符合藏文的卷积循环神经网络CRNN(Convolutional Recurrent Neural Network)与连接时域分类CTC(Connectionist Temporal Classification)相结合的自然场景藏文识别模型,采用基于滑动窗的行识别技术,解决行文字较长的粘连文字识别问题;采用二维串识别技术,即横向以字符为单位的串识别核心与纵向以字母为单位的串识别核心,分别用来识别以现代藏文字符为主的高频字符和以梵文藏文转写字为主的低频字符。这些技术方法对自然场景藏文识别效果有显著提升,通过对600个样本进行测试得出平均准确率为93.24%。 展开更多
关键词 藏文 藏文识别 自然场景 深度学习
下载PDF
基于GA-BP神经网络的脱机手写藏文识别方法
11
作者 梁会方 《软件导刊》 2013年第9期79-80,共2页
通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GA-BP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和... 通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GA-BP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。 展开更多
关键词 脱机手写藏文识别 GA—BP神经网络 特征提取
下载PDF
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
12
作者 才让当知 黄鹤鸣 +1 位作者 李鑫元 张会云 《中文信息学报》 CSCD 北大核心 2023年第12期62-69,75,共9页
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文... 藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文本识别。首先,在CNN的每个卷积层中添加循环连接,增强CNN提取乌梅字粘连片段的特征和集成上下文信息的能力;其次,对提取的图像文本特征序列采用BiLSTM进行建模;最后,采用字丁切分模块增强CTC对图像序列和标签对齐的监督能力。在自行构建的Cursive Script-C517测试数据集上,该模型的最高准确率和平均准确率分别达到了99.80%和91.43%,分别比基线提高了1.45和48.47个百分点。此外,通过字符级词典库训练,使模型的训练时间减少了13.63%。实验表明,该方法有效解决了乌梅字体中笔画粘连和交错现象严重导致的识别错误问题,显著提升了印刷体藏文乌梅识别精度,减少了训练时间,且具有较好的鲁棒性。 展开更多
关键词 循环卷积神经网络 印刷体藏文识别 图像序列识别 印刷体藏文乌梅识别 藏文字丁切分
下载PDF
结合级联技术的藏文预训练命名实体识别模型
13
作者 徐泽辉 珠杰 +3 位作者 许泽洲 汪超 严松思 刘亚姗 《中文信息学报》 CSCD 北大核心 2023年第11期23-28,共6页
命名实体识别是藏文自然语言处理中的一项关键任务,该文提出了结合三种藏文预训练模型(Word2Vec、ELMo、ALBERT)的Casade-BiLSTM-CRF结构。级联技术(Cascade)将藏文命名实体识别划分为两个子任务(实体边界划分,实体类别判断)分阶段进行... 命名实体识别是藏文自然语言处理中的一项关键任务,该文提出了结合三种藏文预训练模型(Word2Vec、ELMo、ALBERT)的Casade-BiLSTM-CRF结构。级联技术(Cascade)将藏文命名实体识别划分为两个子任务(实体边界划分,实体类别判断)分阶段进行,简化了模型结构;使用藏文预训练模型,能更好地学习藏文先验知识。实验表明,Cascade-BiLSTM-CRF模型相比于BiLSTM-CRF模型训练一轮时间缩短了28.30%;而将级联技术与预训练技术相结合,在取得更好识别效果的同时还缩短了模型训练时间。 展开更多
关键词 藏文命名实体识别 级联 预训练
下载PDF
基于几何形状分析的藏文字符识别 被引量:11
14
作者 周纬 陈良育 曾振柄 《计算机工程与应用》 CSCD 2012年第18期201-205,共5页
在分析藏文的几何结构的基础上,提出了一种基于几何形状分析的藏文识别方法。通过对藏文的辅音和元音符号的几何特征提取,达到学习的目的,根据印刷体藏文的组成结构特征,对其进行切分,进而分别对切分结果进行识别,将藏文字符转译为拉丁... 在分析藏文的几何结构的基础上,提出了一种基于几何形状分析的藏文识别方法。通过对藏文的辅音和元音符号的几何特征提取,达到学习的目的,根据印刷体藏文的组成结构特征,对其进行切分,进而分别对切分结果进行识别,将藏文字符转译为拉丁文,使得即使不认识藏文的人也能"读"藏文。实验结果表明,该方法的正确率达89%以上。 展开更多
关键词 文字识别 藏文识别 人工智能
下载PDF
藏文基本字符识别算法研究 被引量:16
15
作者 王维兰 《西北民族学院学报(自然科学版)》 1999年第3期20-23,51,共5页
对藏文基本字符用投影法:垂直、水平、两对角线四个方向五个子特征进行研究,并给出了特征抽取、模式匹配、字符分类的算法.
关键词 藏文识别 特征抽取 算法 藏文基本字符 字符分类
下载PDF
基于Tesseract_OCR的藏文手写乌金体研究
16
作者 唐梦坤 陈汝真 +2 位作者 陈柏霖 贾裕民 马柯研 《长江信息通信》 2024年第3期144-147,共4页
目前,关于藏文手写乌金体识别的研究较为有限,因此研究藏文手写乌金体识别系统有一定意义。文章的主要研究内容包括利用Tesseract_OCR识别引擎来实现对藏文手写乌金体的自动识别以及相关字库的训练。同时,本文使用Matlab编程语言来高效... 目前,关于藏文手写乌金体识别的研究较为有限,因此研究藏文手写乌金体识别系统有一定意义。文章的主要研究内容包括利用Tesseract_OCR识别引擎来实现对藏文手写乌金体的自动识别以及相关字库的训练。同时,本文使用Matlab编程语言来高效处理数据集,并采用Python编程语言构建了一个藏文手写乌金体识别系统。实验结果表明,通过采用本系统的方法,显著提升了Tesseract_OCR对藏文手写乌金体的识别准确度以及字库的质量。这项研究不仅对于藏文手写体识别技术的发展具有重要意义,还为保护和传承乌金体文化遗产提供了有力的工具。未来的研究将继续探索基于Tesseract_OCR的藏文手写体识别方法,并进一步优化系统以提高识别性能。 展开更多
关键词 藏文手写体识别 Tesseract_OCR 图像预处理 灰度二值化 形态学处理
下载PDF
印刷体藏文文字识别技术研究 被引量:10
17
作者 欧珠 普次仁 +3 位作者 大罗桑朗杰 赵栋才 刘芳 边巴旺堆 《计算机工程与应用》 CSCD 北大核心 2009年第24期165-169,172,共6页
藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于... 藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于网格的模糊笔划特征提取等。实验结果说明,这些方法可提高印刷体藏文文字识别系统的正确识别率和抗干扰能力。 展开更多
关键词 印刷体藏文字符 切分 藏文文字识别 光学字符识别
下载PDF
最大熵和条件随机场模型相融合的藏文人名识别 被引量:20
18
作者 加羊吉 李亚超 +1 位作者 宗成庆 于洪志 《中文信息学报》 CSCD 北大核心 2014年第1期107-112,共6页
藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相... 藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。 展开更多
关键词 藏文人名识别 最大熵 条件随机场
下载PDF
藏文印刷体字符识别技术研究 被引量:8
19
作者 李永忠 王玉雷 刘真真 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第1期55-62,共8页
在分析了现有的藏文字符特征提取方法-图像投影法和方向线素法的基础上,运用分形矩理论和粗网格法,实现了基于分形矩的藏文字符特征提取方法和改进粗网格法藏文字符特征提取.用分形矩方法提取的特征有效地反映了藏文字丁的局部和全局特... 在分析了现有的藏文字符特征提取方法-图像投影法和方向线素法的基础上,运用分形矩理论和粗网格法,实现了基于分形矩的藏文字符特征提取方法和改进粗网格法藏文字符特征提取.用分形矩方法提取的特征有效地反映了藏文字丁的局部和全局特征,减少了图像中因像素位置变化而降低识别率的影响.用改进粗网格法提取的字符特征不仅能有效地减少因图像像素位置变化造成的识别率下降的影响,而且在一定程度上克服了藏文字符过多而造成的误识别率过高的缺点.通过实验对比,分形矩和改进粗网格法与方向线素特征提取方法的在识别率相同情况下,运算速度快,且在一定程度上克服了藏文字丁极多而造成的误识率高的缺点. 展开更多
关键词 藏文字符识别 分形矩 特征提取 粗网格
下载PDF
基于置信度的藏文人名识别的主动学习模型研究 被引量:4
20
作者 王志娟 刘飞飞 +1 位作者 赵小兵 宋伟 《中文信息学报》 CSCD 北大核心 2019年第8期53-59,共7页
训练语料的标注成本是资源稀缺语言处理研究面临的一个重要问题,通过主动学习(active learning)方法可以选择信息量大、无冗余的语料供人工标注,进而大大降低语料标注成本。该文基于CRF模型给出的标注置信度提出了四种主动学习方法,并... 训练语料的标注成本是资源稀缺语言处理研究面临的一个重要问题,通过主动学习(active learning)方法可以选择信息量大、无冗余的语料供人工标注,进而大大降低语料标注成本。该文基于CRF模型给出的标注置信度提出了四种主动学习方法,并通过实验确定了这四种主动学习方法的相关参数。实验显示:选择置信度低于0.7的语料进行人工标注,直到新旧模型标注结果的差异度小于0.01%时,仅需6轮迭代;人工标注3.2MB的语料,藏文人名识别的F值可以达到88%,若要达到该识别效果,基于CRF的监督式学习模型需要标注约10MB的语料,该主动学习方法降低了约66%的语料标注规模。 展开更多
关键词 藏文人名识别 主动学习 置信度
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部