题名 乌金印刷多字体藏文的文本检测与识别
被引量:1
1
作者
侯闫
高定国
高红梅
机构
西藏大学信息科学技术学院
出处
《计算机工程与设计》
北大核心
2023年第4期1058-1065,共8页
基金
国家自然科学基金项目(62166038)
西藏大学研究生高水平人才培养计划基金项目(2020-GSP-S177)。
文摘
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。
关键词
藏文
乌金字体
多种字体
深度学习
文本检测
文本识别
端到端
Keywords
Tibetan
Wujin font
multiple fonts
deep learning
text detection
text recognition
end to end
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 面向社交媒体的藏文图文多字体检测与识别研究
2
作者
拥措
龙炳鑫
拉毛杰
仁青东主
尼玛扎西
机构
西藏大学信息科学技术学院
西藏自治区藏文信息技术人工智能重点实验室
藏文信息技术教育部工程研究中心
出处
《高原科学研究》
CSCD
2023年第4期76-85,共10页
基金
科技创新2030——“新一代人工智能”重大项目(2022ZD0116100)
西藏自治区科技创新基地自主研究项目(XZ2021JR0002G)。
文摘
社交媒体为大众沟通交流与信息传播提供了更为便捷的平台。文章针对当前社交媒体中藏文图文背景复杂、多字体、字体混排和版式多样等特点,构建了社交媒体藏文图文识别数据集,提出一种融合PSENET和CRNN(卷积循环神经网络)的端到端检测识别算法。该算法利用PSENET进行多角度的文本检测,再结合基于多头注意力机制的CRNN模型进行文字识别。实验结果表明,检测率和多字体识别率分别达到了95.7%和84.5%,相较于无预训练模型和CTC(连接时序分类)识别模型,准确率分别提高了34.6%和4.14%。表明该方法在解决社交媒体中藏文图文多字体识别问题上具有较好的实用价值和应用前景。
关键词
社交媒体
藏文
多字体
文字识别
Keywords
social media
Tibetan
multi-font
character recognition
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 乌梅印刷多字体藏文文本的检测与识别
3
作者
高定国
侯闫
高红梅
索朗曲珍
机构
西藏大学信息科学技术学院
藏文信息技术创新人才培养示范基地
出处
《高原科学研究》
CSCD
2023年第1期92-100,共9页
基金
国家自然科学基金项目(62166038)
西藏大学研究生高水平人才培养计划项目(2020-GSP-S177)。
文摘
随着藏文信息处理技术的发展,藏文乌金字体的识别取得了很好的效果,但藏文乌梅字体由于书写风格差异大,检测和识别难,目前的乌梅字体识别仅限于以字丁识别、单一字体为主。近几年随着计算机字体的丰富,出现了乌梅印刷多字体文本。为了准确识别这类文本,文章基于中英文的预训练模型DBNet开展藏文文本检测,以ResNet-50为骨干网络的CRNN和SRN两种不同编码-解码方式开展端到端的乌梅印刷多字体文本识别,并以实验测试两种模型的识别结果。实验表明,当训练和测试所用字体一致时两个模型的识别效果相当;使用不在训练集中的另外8种乌梅字体进行测试时,SRN识别算法相比CRNN在TCR、TDR和LRA三个评价指标上分别提升0.5363%、1.7681%和3.4875%,表现出更强的泛化能力。
关键词
乌梅
多字体
藏文文本
识别
Keywords
Wumei
multi-font
Tibetan text
recognition
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 藏文古籍手写文档文本区域检测方法研究
4
作者
格桑多吉
白玛旺久
扎西多吉
机构
西藏大学信息科学技术学院
出处
《高原科学研究》
CSCD
2023年第3期102-111,共10页
基金
国家自然科学基金项目(62066042,61961038)
西藏大学科研培育基金项目(ZDQMJH21-13)。
文摘
藏文古籍文本数字化是保护和传承藏文古籍的重要途径,由于藏文古籍具有版面复杂性、多样性和字体大小不一致等特点,传统的经典检测网络难以有效定位小目标文本区域,导致检测效果不理想。文章选择适用于小目标的检测算法YOLOv8基线模型,采用改进后的轻量级骨干网络Faster-Net作为特征提取网络,引入CA注意力机制以更好地利用上下文特征信息,将浅层信息和深层信息有效地结合在一起。实验结果表明,该方法可实现对藏文古籍多字体手写体版面不同字体大小的文本区域定位,其在测试集上的平均精度、准确率和召回率都达到99%以上,适用于藏文古籍版面中字体大小不一致的文本区域目标检测。
关键词
藏文古籍
注意力机制
Faster-Net
手写多字体
Keywords
ancient Tibetan book
tention mechanism
Faster-Net
multiple-font handwriting
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于Web页面的藏文在线输入技术
被引量:1
5
作者
于洪志
何向真
机构
西北民族大学中国民族语言文字教育部重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第18期260-262,265,共4页
基金
国家"863"计划基金资助项目(2003AA115530)
国家社会科学基金资助项目(02BYY038)
教育部科研基金资助重点项目(105172)
文摘
Web页面藏文在线输入技术,能够在浏览器中脱离本机输入法而进行藏文输入,实现藏文网络在线文字交互,为网络系统提供了跨平台的藏文输入解决方案。阐述了基于Web页面藏文在线输入技术的工作原理及基本设计思想,介绍藏文在线输入法的组成、内码外码设计原则和输入法流程,对藏文输入法进行系统分析,给出实现模型,论述浏览器内嵌藏文字体信息技术,达到在线、即时的藏文输入。采用内嵌法和外挂法,实现藏文在线输入技术与主流网页编辑器的整合。
关键词
WEB页面
藏文
在线输入
字体嵌入
Keywords
Web page
Tibetan
online input
font embedded
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 计算机字库方正藏意汉体设计探究
被引量:1
6
作者
杨新忠
李彩林
机构
南昌大学
江西师范大学
出处
《包装工程》
CAS
CSCD
北大核心
2015年第22期132-135,148,共5页
文摘
目的通过对计算机字库中方正藏意汉体的探究,总结其设计特征、方法和原理,为字体进行异域文字意味的创意表现带来启示,提供借鉴与经验。方法采用个案分析与总结法对方正藏意汉体的美学特点、形式构成进行剖析。结论方正藏意汉体开创了计算机字库中一种字体包含两种文字特征的先例,探索了字体创写的多种可能,丰富了计算机汉字字体库。
关键词
方正藏意汉体
艺术特点
审美得失
Keywords
The Founder of Chinese Characters Font of Tibetan Meaning
artistic characteristics
aesthetic gains andlosses
分类号
J524
[艺术—艺术设计]
题名 藏文字库设计中OpenType特征标记的应用研究
7
作者
高定国
格西斯满
机构
西藏大学工学院
四川省马尔康县第二中学
出处
《西藏大学学报(社会科学版)》
2008年第2期29-32,共4页
基金
国家发改委资助项目"汉藏在线翻译多媒体电子辞典"阶段性成果。基金号:发放投资20052171
文摘
基于国际标准实现藏字处理一直是藏文信息处理的难点,OpenType字库的实现解决了该难点,微软Vista操作系统的推出,把藏文等几种少数民族文字的处理推到了一个新的阶段,但Vista自身只带了一个藏文白体字库,不能满足用户对字体的需求。文章分析了OpenType特征标记在藏文字库设计中的应用,有助于设计OpenType藏文字库。
关键词
OPENTYPE
藏文字库
特征标记
Keywords
OpenType
Tibetan Font
Feature tags
分类号
TP317.2
[自动化与计算机技术—计算机软件与理论]
题名 藏文字库标准符合性自动检测方案设计与实现
被引量:1
8
作者
刘瀚猛
芮建武
白真龙
吴健
机构
中国科学院软件研究所
北京科技大学
出处
《中文信息学报》
CSCD
北大核心
2008年第3期124-128,共5页
基金
电子信息产业发展基金藏文软件专项项目
文摘
软件产品的标准符合性测试是衡量产品质量与性能的重要方法。本文根据藏文字符集标准与字型标准,按软件产品的可用性原则,分析与定义了藏文字库标准符合性检测的含义与内容。本文提出了实施藏文字库标准符合性测试的方案与算法,实现了藏文字库测试程序。测试结果表明本文的检测方案可行、完整,也为其他文字的字库标准符合性检测提供了很好的途径。
关键词
计算机应用
中文信息处理
藏文
字库
标准符合性
测试
Keywords
computer application
Chinese information processing
Tibetan
font
standard conformance
test
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 数字化藏文古籍中多样性字体的实现方法研究
被引量:3
9
作者
朱倩倩
车文刚
苗晗
机构
昆明理工大学信息工程与自动化学院
出处
《计算机工程与科学》
CSCD
北大核心
2020年第11期2073-2079,共7页
文摘
计算机成为数据共享和信息交流的工具之后,统一的计算机字体使得文字失去了手写字的多样性与离散性。文字是文化传播和文明传承的关键因素,许多古籍电子化以后失去了原版古籍中具有文化背景和历史意义的特色字体。例如堪称藏族文化一绝的具有多样性和离散性的雕刻字体。为了解决这个问题,提出了将藏文古籍中雕刻字体数字化的方法。结合投影法与连通域法切分古籍图像;通过GIST特征算法实现图像文字的识别;采用SIFT特征算法实现图像字体风格分类,获取古籍中不同风格的雕刻字体;提出字体多样性表达算法实现古籍中雕刻字体的多样性和离散性。研究的目的是传承和保护雕刻字体,具有重要的文化研究和传承意义。
关键词
藏文古籍
图像分割
藏文识别
字体分类
字体多样性表达算法
Keywords
Tibetan ancient book
image segmentation
Tibetan recognition
font classification
font diversity expression algorithm
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于神经网络的多字体藏文印刷体字丁识别
被引量:1
10
作者
三知加
贡去卓么
才让加
卓玛扎西
机构
青海师范大学计算机学院
青海省藏文信息处理与机器翻译重点实验室
藏文信息处理教育部重点实验室
青海省藏文信息处理工程技术研究中心
出处
《计算机仿真》
北大核心
2022年第10期214-218,共5页
文摘
针对多字体藏文字丁数据集匮乏的现状和藏文印刷体多字体字丁的识别问题,构建了一个含有数据规模为48960张字丁图像的藏文印刷体字丁数据集(Tibetan Printed Character Dataset, TPCD),并对TPCD数据集进行了标记,归一化和二值化的预处理。运用各类包括支持向量机、前馈神经网络和卷积网络等线性统计和深度学习方法对数据集中的藏文字丁进行了识别实验。对实验结果进行评测后,提出的基于神经网络的模型可以使多字体藏文印刷体识别任务在测试集上的识别率、召回率和F1值分别达到了97%、96.6%和96.6%,证实了上述方法的有效性,为后续藏文文字识别提供了一定的理论和研究的基础。
关键词
藏文印刷体字丁数据集
卷积神经网络
多字体
藏文字丁
印刷体字丁识别
藏文构件
Keywords
TPCD
CNN
Multi-font
Tibetan character
Printed character recognition
Tibetan character component
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 藏文编码字符集构件集点阵字型的设计
被引量:1
11
作者
王晓军
才科扎西
机构
西北民族学院数学系
出处
《西北民族大学学报(自然科学版)》
1998年第1期17-20,共4页
基金
国家民委科研基金资助
文摘
分析了藏文字符的结构特征,系统阐述了“藏文编码字符集构件集点阵字型”的设计原则、编码技术,这对进一步研制开放性藏文系统提供了理论依据。
关键词
藏文
编码字符集
构件集
点阵字型
Keywords
Tibetan
Coded
Character Set
Component Set
Dots Matrix Font
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]