-
题名融合语言特性的越南语兼类词消歧
被引量:2
- 1
-
-
作者
郭剑毅
赵晨
刘艳超
毛存礼
余正涛
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《数据采集与处理》
CSCD
北大核心
2019年第4期577-584,共8页
-
基金
国家自然科学基金(61262041,61562052,61662041)资助项目,国家自然科学基金重点(61732005)资助项目
-
文摘
兼类词歧义直接影响词性标注的准确率。本文针对越南语兼类词歧义问题提出一种融合语言特性的越南语兼类词消歧方法。通过构建越南语兼类词词典和兼类词语料库,分析越南语的语言特征和兼类词特点,选取有效的特征集;然后利用条件随机场能添加任意特征等优点,在使用词和词性上下文信息的同时,引入句法成分和指示词特征,得到消歧模型。最后在兼类词语料上实验,准确率达到了87.23%。实验表明本文所提出的越南语兼类词消歧方法有效可行,可以提高词性标注正确率。
-
关键词
兼类词消歧
兼类词词典
兼类词语料库
语言特征
条件随机场模型
越南语
-
Keywords
multi-category words disambiguation
multi-category words dictionary
multi-category words corpus
linguistic characteristics
conditional random fields model
Vietnamese
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-