-
题名基于句子跨度的哈萨克语句法分析研究
被引量:1
- 1
-
-
作者
柴伟
古丽拉·阿东别克
-
机构
新疆大学信息科学与工程学院
新疆多语种信息技术实验室
国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第3期731-733,753,共4页
-
基金
国家自然科学基金资助项目(61363062)。
-
文摘
由于目前哈萨克语句法分析准确率较低并缺乏基于神经网络的哈萨克语句法分析的相关研究,针对哈萨克语短语结构的句法分析,使用基于移进—归约的方法,采用在栈中存储句子跨度而不是部分树结构,从而在进行句法树解析时不需要对句法树进行二叉化。该研究在句子特征提取时使用双向LSTM对句子跨度特征进行提取,得到句子跨度在整个句子上下文中信息,再使用多层感知机对句法分析模型进行训练,最后在解码时使用动态规划选取最优句法分析结果;最终使得哈萨克语短语句法分析准确率达到了76.92%。研究成果对哈萨克语句法分析准确率有了进一步的提高,并为后续的哈萨克语机器翻译及语义分析奠定良好的基础。
-
关键词
双向LSTM
句子跨度
动态规划
-
Keywords
Bi-LSTM
span
dynamic oracle
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-