-
题名判别式藏语文本词性标注研究
被引量:9
- 1
-
-
作者
华却才让
刘群
赵海兴
-
机构
陕西师范大学计算机学院
青海师范大学计算机学院
中国科学院计算技术研究所智能信息处理重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2014年第2期56-60,共5页
-
基金
973计划前期研究专项(2010CB334708)
国家自然科学基金(61063033
+2 种基金
61163018
61363055)
教育部"春晖计划"合作科研项目(Z2012102)
-
文摘
该文在分析了现有藏文词性标注方法的基础上,提出感知机训练模型的判别式藏语词性标注方法,重点研究了符合藏语词法特性的模型训练特征模板、模型训练和词性标注方法。并且在人工标注的测试集上获得了98.26%的词性标注精确率,可以实际应用到藏语自然语言处理中。
-
关键词
词性标注
感知机模型
特征选择
藏语词性标注
-
Keywords
POS tagging
perceptron model
feature selection
Tibetan part-of-speech tagging
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HMM的藏语语料库词性自动标注研究
被引量:6
- 2
-
-
作者
苏俊峰
祁坤钰
本太
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《西北民族大学学报(自然科学版)》
2009年第1期42-45,共4页
-
基金
<现代藏语语法信息词典>建设研究
甘肃省社科规划项目
项目编号2007-04
-
文摘
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.
-
关键词
藏语词性标注
词性标注集
HMM
-
Keywords
Tibetan part of speech tagging
Tagging set
HMM
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HMM藏文词性标注的研究与实现
被引量:4
- 3
-
-
作者
扎西多杰
安见才让
-
机构
青海民族大学计算机学院
-
出处
《计算机光盘软件与应用》
2012年第12期100-101,共2页
-
文摘
藏语词性标注技术在藏文信息处理领域中占有十分重要的地位,本文主要对基于hmm的藏语词性标注技术进行了研究,所实现的词性标注系统主要通过隐马尔科夫模型对训练语料库进行数据统计,获取词性和词汇概率信息,并采用Viterbi算法进行标注。
-
关键词
藏语词性标注
隐马科夫模型
VITERBI算法
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-