-
题名基于藏文字符感知的文本预训练模型方法研究
- 1
-
-
作者
洛桑嘎登
尼玛扎西
-
机构
西藏大学信息科学技术学院
西藏大学西藏自治区藏文信息技术人工智能重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第21期127-133,共7页
-
基金
国家科技创新2030—“新一代人工智能”重大项目(2022ZD0116101)
西藏大学在职攻读博士学位及博士后进站研究人员科研资助项目(zdbs202328)。
-
文摘
目前藏文预训练模型主要使用音节作为藏文单词表示。采用音节嵌入构建藏文单词表示,会存在藏文单词表示不完整且鲁棒性不高的问题。为了应对这一挑战,提出了一个名为藏文字符感知的预训练模型,该模型融合藏文字符、字丁和音节三个维度的特征,从藏文更细粒度的信息表征藏文单词特征。利用原始数据集和对抗性拼写错误测试集,评估了所提出的方法在藏文自动分词和命名实体识别任务上的性能。实验结果表明,该方法可以同时提高藏文预训练语言模型的性能和鲁棒性。
-
关键词
藏文
预训练模型
字符感知
-
Keywords
Tibetan
pre-training model
character awareness
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于字符区域感知的端到端车牌识别方法
- 2
-
-
作者
李岩
舒言
范晓焓
宿汉辰
李斌阳
-
机构
国际关系学院网络空间安全学院
哈尔滨工业大学计算机科学与技术学院
-
出处
《无线电工程》
北大核心
2022年第6期940-946,共7页
-
基金
国际关系学院国家安全高精尖学科建设科研专项(2019GA43,2021GA07)。
-
文摘
随着智能交通领域车牌应用需求的升级,自然场景下的车牌识别依然面临挑战。针对多变的自然光照以及多样的拍摄角度导致的车牌识别精度与实时性无法兼顾的问题,提出了一种基于字符区域感知的端到端车牌识别算法。通过引入字符区域感知网络直接在图像中定位字符,无需车牌检测即可直接对字符进行识别,有效优化了车牌识别流程。使用ResNet18作为主干网络,结合FPEM和FFM组合成的低计算分割头弥补轻量级网络的缺陷,在不降低算法精度的前提下使其具有良好的实时性。构造车牌内容相关人造数据集对字符感知网络进行预训练,进一步提升字符感知能力和算法精度。在CCPD数据集上的实验结果表明,与现有车牌识别方法相比,所提出的算法在推理速度保持6帧/秒的情况下平均准确率可达46%,比现有的基线模型超出约3%。
-
关键词
车牌识别
端到端训练
字符区域感知
卷积神经网络
人造车牌字符数据集
-
Keywords
license plate recognition
end-to-end training
character region awareness
convolutional neural network
artificial data set of license plate character
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-