-
题名一种端到端的藏文La格浅层语义分析
- 1
-
-
作者
班玛宝
色差甲
才让加
张瑞
柔特
-
机构
青海师范大学计算机学院
省部共建藏语智能信息处理及应用国家重点实验室
青海省藏文信息处理与机器翻译重点实验室
藏文信息处理教育部重点实验室
青海省藏文信息处理工程技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2023年第2期62-70,共9页
-
基金
国家自然科学基金(61866032,619660316,62206146)
青海省重点研发项目(2022-GX-104)。
-
文摘
该文通过详细分析La格的用法及特征,在研制La格(■)浅层语义标记规范的基础上,提出一种端到端的长短时记忆神经网络藏文La格浅层语义分析方法,该方法首先借鉴LSTM的设计思路,通过在LSTM的垂直方向上装置一个新颖的“门控高速连接”机制(Gated high-speed connection mechanism,GM),学习了输入句子的时序语义特征。GM包含对单元内部输入和输出的线性连接,使信息可以通畅地在不同层之间传播;然后使用Softmax计算每一时刻语义标签的局部归一化分布,以供输出层进行约束解码;最后使用维特比算法进行解码时通过强制执行该文设定的BIO和La格浅层语义标注约束,规范了输出语义标签之间的结构关系。虽然这个模型比较简单,不需要输入任何额外特征,但取得了理想的实验结果,在测试集上的藏文La格浅层语义分析准确率达到90.59%。
-
关键词
自然语言处理
La格
浅层语义分析
门控高速连接
约束解码
-
Keywords
NLP
La case
shallow semantic analysis
gated high-speed connection
constraint decoding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-