期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
多字体印刷藏文内容监测系统研究
1
作者 江涛 于洪志 +1 位作者 李艾林 窦嵘 《信息网络安全》 2012年第8期210-211,共2页
针对藏文舆情分析中藏文印刷品和藏文图片内容无法自动监测的难题,文章在深入分析印刷藏文字符特征和藏文文本特点的基础上,提出支持多字体印刷藏文内容监测系统的实现方法,重点阐述藏文字符的特征提取、分类算法以及藏文文本内容监测... 针对藏文舆情分析中藏文印刷品和藏文图片内容无法自动监测的难题,文章在深入分析印刷藏文字符特征和藏文文本特点的基础上,提出支持多字体印刷藏文内容监测系统的实现方法,重点阐述藏文字符的特征提取、分类算法以及藏文文本内容监测方法。 展开更多
关键词 印刷藏文 内容监测 特征选择 分类
下载PDF
印刷体现代藏文识别研究 被引量:23
2
作者 王维兰 丁晓青 +1 位作者 陈力 王华 《计算机工程》 CAS CSCD 北大核心 2003年第3期37-38,94,共3页
以印刷体现代藏文白体、黑体、圆体、长体、竹体为字体样张,通过预处理、文 本行字切分、特征选择和分类识别的初步研究,获得对5种字体文本的平均识别率为89.582 % ,对其他字体的文本平均识别率为93.867%。
关键词 印刷藏文 预处理 特征选择 分类识别 模式识别 藏文识别
下载PDF
印刷体藏文文字识别技术研究 被引量:11
3
作者 欧珠 普次仁 +3 位作者 大罗桑朗杰 赵栋才 刘芳 边巴旺堆 《计算机工程与应用》 CSCD 北大核心 2009年第24期165-169,172,共6页
藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于... 藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于网格的模糊笔划特征提取等。实验结果说明,这些方法可提高印刷体藏文文字识别系统的正确识别率和抗干扰能力。 展开更多
关键词 印刷藏文字符 切分 藏文文字识别 光学字符识别
下载PDF
藏文出版印刷初探 被引量:3
4
作者 陆洋 《北京印刷学院学报》 2007年第3期18-21,共4页
藏文的创制为藏文刊物的印刷出版提供了最重要的条件。公元13世纪,汉族地区的雕版印刷术传入,为藏区木刻雕版印刷形式的产生提供了契机。当雕刻技术与原有的藏区寺院出版文化的胚胎相融合时,立即迸发出耀眼的火花,藏族历史上专门的出版... 藏文的创制为藏文刊物的印刷出版提供了最重要的条件。公元13世纪,汉族地区的雕版印刷术传入,为藏区木刻雕版印刷形式的产生提供了契机。当雕刻技术与原有的藏区寺院出版文化的胚胎相融合时,立即迸发出耀眼的火花,藏族历史上专门的出版机构——印经院形成了。近代以前,寺院印刷基本代表了藏区独特的印刷出版文化特色,所刊印书籍主要为藏传佛教服务。解放后,藏文出版印刷事业发展迅猛,不仅保证了藏族文化的延续和发展,还积极宣传主流社会的价值观,提高了藏民的科学文化素质。但同时,藏文的印刷出版业也面临着诸多的困难和压力。探究影响其发展的主要因素,找准成因,对症下药,必将促进藏文印刷出版事业的发展。 展开更多
关键词 藏文印刷 藏文出版 藏文雕版印刷 印经院
下载PDF
印刷体藏文识别技术 被引量:7
5
作者 吴刚 德熙嘉措 黄鹤鸣 《青海师范大学学报(自然科学版)》 2006年第1期32-37,共6页
藏文字符识别是中国的多文种信息处理系统的重要组成部分,本文论述了印刷体藏文识别系统的原理和预处理、识别、后处理过程,分析了文字识别的常用方法及其优缺点和印刷体藏文识别技术,着重分析了印刷体藏文识别中特征提取和分类器设计... 藏文字符识别是中国的多文种信息处理系统的重要组成部分,本文论述了印刷体藏文识别系统的原理和预处理、识别、后处理过程,分析了文字识别的常用方法及其优缺点和印刷体藏文识别技术,着重分析了印刷体藏文识别中特征提取和分类器设计这两个关键技术,并对藏文识别研究领域今后的研究方向和发展前景提出了自己的看法. 展开更多
关键词 藏文信息技术 模式识别 印刷藏文识别 方向线素
下载PDF
基于音节切分的藏文印刷体识别 被引量:2
6
作者 才让当知 华却才让 黄鹤鸣 《计算机工程与设计》 北大核心 2022年第9期2594-2600,共7页
为解决藏文印刷体标注数据库资源稀少和藏文图像文本分割难度大等问题,提出一种基于音节切分的藏文体印刷体识别方法。以字符面积最小为依据,找到音节分隔符;合并音节分隔符之间的字丁,构成音节;按音节位置进行分割,经实验分割准确率提... 为解决藏文印刷体标注数据库资源稀少和藏文图像文本分割难度大等问题,提出一种基于音节切分的藏文体印刷体识别方法。以字符面积最小为依据,找到音节分隔符;合并音节分隔符之间的字丁,构成音节;按音节位置进行分割,经实验分割准确率提升3.92个百分点。为验证选择音节的有效性,在同一结构的LetNet-5网络模型上进行测试,实验结果表明,以音节为单元时识别性能更优,其平均识别正确率达96.11%。 展开更多
关键词 藏文印刷体识别 音节切分 字丁切分 文本分割 卷积神经网络
下载PDF
印刷体藏文识别中字符切分方法的研究 被引量:3
7
作者 公保杰 安见才让 《计算机时代》 2019年第9期24-26,共3页
印刷体藏文字符的准确切分是识别的关键,由于藏文字符结构的特殊性导致字符之间会出现重叠粘连的现象,使得切分很困难。文章提出多策略细化切分方法,首先用积分投影法实现行和单字的粗切分,再对重叠粘连的字符,根据连通域、藏文字符基... 印刷体藏文字符的准确切分是识别的关键,由于藏文字符结构的特殊性导致字符之间会出现重叠粘连的现象,使得切分很困难。文章提出多策略细化切分方法,首先用积分投影法实现行和单字的粗切分,再对重叠粘连的字符,根据连通域、藏文字符基线位置像素的统计、字符宽度等信息进行细切分。实验表明,该切分方法提高了印刷体藏文字符切分的准确率,为提高印刷体藏文的识别效率提供基础。 展开更多
关键词 印刷藏文 积分投影 切分
下载PDF
基于神经网络的多字体藏文印刷体字丁识别 被引量:1
8
作者 三知加 贡去卓么 +1 位作者 才让加 卓玛扎西 《计算机仿真》 北大核心 2022年第10期214-218,共5页
针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处... 针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处理。运用各类包括支持向量机、前馈神经网络和卷积网络等线性统计和深度学习方法对数据集中的藏文字丁进行了识别实验。对实验结果进行评测后,提出的基于神经网络的模型可以使多字体藏文印刷体识别任务在测试集上的识别率、召回率和F1值分别达到了97%、96.6%和96.6%,证实了上述方法的有效性,为后续藏文文字识别提供了一定的理论和研究的基础。 展开更多
关键词 藏文印刷体字丁数据集 卷积神经网络 多字体 藏文字丁 印刷体字丁识别 藏文构件
下载PDF
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
9
作者 才让当知 黄鹤鸣 +1 位作者 李鑫元 张会云 《中文信息学报》 CSCD 北大核心 2023年第12期62-69,75,共9页
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文... 藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文本识别。首先,在CNN的每个卷积层中添加循环连接,增强CNN提取乌梅字粘连片段的特征和集成上下文信息的能力;其次,对提取的图像文本特征序列采用BiLSTM进行建模;最后,采用字丁切分模块增强CTC对图像序列和标签对齐的监督能力。在自行构建的Cursive Script-C517测试数据集上,该模型的最高准确率和平均准确率分别达到了99.80%和91.43%,分别比基线提高了1.45和48.47个百分点。此外,通过字符级词典库训练,使模型的训练时间减少了13.63%。实验表明,该方法有效解决了乌梅字体中笔画粘连和交错现象严重导致的识别错误问题,显著提升了印刷体藏文乌梅识别精度,减少了训练时间,且具有较好的鲁棒性。 展开更多
关键词 循环卷积神经网络 印刷藏文识别 图像序列识别 印刷藏文乌梅识别 藏文字丁切分
下载PDF
基于深度学习的藏文现代印刷物版面检测技术研究
10
作者 吴燕如 珠杰 管美静 《南京师范大学学报(工程技术版)》 CAS 2021年第1期44-48,共5页
针对藏文现代图书版面中的文本行分布不均匀、现代藏文字体差异较大的问题,提出了一种基于Faster R-CNN的版面文本行检测算法.通过在整理标注的数据集上训练,用ResNet-50网络提取出藏文现代图书版面特征信息.为了有效提高模型的泛化能力... 针对藏文现代图书版面中的文本行分布不均匀、现代藏文字体差异较大的问题,提出了一种基于Faster R-CNN的版面文本行检测算法.通过在整理标注的数据集上训练,用ResNet-50网络提取出藏文现代图书版面特征信息.为了有效提高模型的泛化能力,在COCO数据集下的网络模型中进行迁移学习.实验结果表明,该方法可对藏文现代印刷物的版面实现文本行的定位,检测准确率为83%,召回率为95%,明显提高了版面检测的精确度. 展开更多
关键词 深度学习 藏文现代印刷 FASTER R-CNN 版面检测
下载PDF
德格印经院创建及扩建过程考 被引量:5
11
作者 巴多 《西南民族大学学报(人文社会科学版)》 CSSCI 北大核心 2020年第12期39-44,共6页
藏文雕版印刷的成熟、大藏经的刊刻高潮与德格融合的教派环境,促使素有"藏文化大百科全书"、"藏族地区璀璨的文化明珠"盛名的德格印经院从诞生走向辉煌;其创建年代,目前学界普遍认为是1729年。但1941年前的相关文... 藏文雕版印刷的成熟、大藏经的刊刻高潮与德格融合的教派环境,促使素有"藏文化大百科全书"、"藏族地区璀璨的文化明珠"盛名的德格印经院从诞生走向辉煌;其创建年代,目前学界普遍认为是1729年。但1941年前的相关文献显示,最晚在1717年德格印经院就已经存在;1733年《甘珠尔》雕版竣工完成后,题名为《甘珠尔》印经院;在此基础上,完成《丹珠尔》刻版后,1744年扩建了《丹珠尔》印经院。至1747年,德格印经院主体建筑及室内壁画全部竣工。1988年维修后,德格印经院更加优美壮观。 展开更多
关键词 德格印经院 创建年代 藏文文献 藏文雕版印刷
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部