-
题名基于树库转换的藏语依存句法树库构建方法
被引量:1
- 1
-
-
作者
周毛克
龙从军
赵小兵
李林霞
-
机构
中央民族大学中国少数民族语言文学学院
国家语言资源监测与研究少数民族语言中心
中国社会科学院民族学与人类学研究所
中央民族大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第7期77-85,97,共10页
-
基金
国家语委中心项目(ZDI135-98)
中央民族大学研究生科研实践项目(BZKY2022073)。
-
文摘
构建藏语依存树库是实现藏语句法分析的重要基础,对藏语本体研究和信息处理具有重要价值。基于此,该文提出了一种基于树库转换的藏语依存树库构建方法。该方法首先扩充了前期构建的藏语短语结构树库,然后根据藏语短语结构树和依存树的特征设计树库转换规则,实现藏语短语结构树到依存结构树的初步转换,最后对自动转换结果进行人工校验,得到了2.2万句藏语依存树。为了对转换结果做出量化评价,该文抽取了依存树库中5%的依存树,对其依存关系进行校验和统计,最终依存关系的准确率达到89.36%,中心词的准确率达到92.09%。此外,该文使用基于神经网络的句法分析模型验证了依存树库的有效性。在该模型上,UAS值和LAS值分别达到83.62%和81.90%。研究证明,使用半自动的树库转换方法能够有效地完成藏语依存树库构建工作。
-
关键词
藏语
依存树库
树库转换
-
Keywords
Tibetan
dependency treebank
treebank conversion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-