-
题名英汉对比视角下的中英文词性标注集分析
被引量:1
- 1
-
-
作者
李晓雨
-
机构
北京航空航天大学外国语学院
-
出处
《海外英语》
2017年第3期191-192,共2页
-
文摘
计算所汉语词性标记集(ICTPOS3.0)和CLAWS7 POS Tagset词性赋码集是当前对中文和英文赋码准确率较高,同时接受程度较高的两个词性标注集。该文试以名词作为出发点,描写不同语言特点下词性赋码的异同。标注可以为语料库带来增值,因而就要求对标注进行不断地优化,以提高准确率。希望通过对中英文词性标注集的对比能使两个标注集进行互补优化。
-
关键词
英汉对比
名词特征
中英文词性标注集
-
分类号
H0
[语言文字—语言学]
-
-
题名方块苗文词性标注集的设计
被引量:1
- 2
-
-
作者
周潭
莫礼平
曾虎
雷智
李文宇
吴莹
-
机构
吉首大学信息科学与工程学院
-
出处
《智能计算机与应用》
2019年第1期131-134,共4页
-
基金
国家自然科学基金(61462029)
吉首大学本科生科研项目(JDX17027
+4 种基金
2018JDX09)
大学生研究性学习和创新性实验计划项目(湘教通[2018]255号文件
599
吉首大学教通2018[15]号文件
JDCX2018012)
-
文摘
词性标注集是计算机处理自然语言时进行词类表示的工具。任何自然语言的词性标注都必须以词性标注集为基础。本文根据方块苗文信息化的实际需要,结合方块苗文的造字原理及词语的使用特点,在介绍对词性标注及标注集相关概念的基础上,参考汉语词性标注规范设计方法,基本确定了方块苗文的词性和种类,设计了方块苗文的词性标注符号和基于语法范畴的分类标记体系;初步制订了用于方块苗文信息处理领域的词性标注集,在某种意义上为方块苗文词性标注建立了参考标准。
-
关键词
自然语言处理
方块苗文
词性标注
词性标注集
-
Keywords
natural language processing
square Hmong character
part-of-speech tagging
part-of-speech tag set
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HMM的藏语语料库词性自动标注研究
被引量:6
- 3
-
-
作者
苏俊峰
祁坤钰
本太
-
机构
西北民族大学中国民族信息技术研究院
-
出处
《西北民族大学学报(自然科学版)》
2009年第1期42-45,共4页
-
基金
<现代藏语语法信息词典>建设研究
甘肃省社科规划项目
项目编号2007-04
-
文摘
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.
-
关键词
藏语词性标注
词性标注集
HMM
-
Keywords
Tibetan part of speech tagging
Tagging set
HMM
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HMM的维吾尔语词性标注研究
被引量:1
- 4
-
-
作者
李萍
杨勇
赛买提.艾力
任鸽
-
机构
新疆师范大学计算机科学技术学院
-
出处
《现代计算机》
2017年第5期11-14,共4页
-
基金
新疆师范大学优秀青年教师科研启动基金项目(No.XJNU201420)
-
文摘
在维吾尔语与汉语的机器翻译的研究中,词性标注起到很大的作用,词性标注也是自然语言处理的基础性工作。介绍基于隐马尔可夫模型的词性标注算法和词性标注器Citar,并且将Citar标注器应用到维吾尔语上进行词性标注。为了能对维吾尔语进行词性标注,在在布朗词性标注集的基础上,定义一套适用于维吾尔语的词性标注集,采用基于隐马尔可夫模型的方法,对部分维吾尔语进行词性标注实验,经过实验表明,Citar标注器能准确对维吾尔语进行词性标注,从而表明此标注器适用于维吾尔语。
-
关键词
机器翻译
词性标注
隐马尔可夫模型
词性标注集
维吾尔语
-
Keywords
Machine Translation
Part-of-Speech Tagging
HMM
Part-of-Speech Tagging Sets
Uyghur
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名现代维吾尔语动词标记集验证性研究
- 5
-
-
作者
努尔加玛力.沙依提
艾孜尔古丽
玉素甫.艾白都拉
-
机构
新疆师范大学
-
出处
《电子制作》
2014年第11X期188-189,共2页
-
基金
国家自然科学基金重点项目(No.61132009)
国家自然科学基金项目(No.61262066)
+2 种基金
国家自然科学基金重点项目(No.61132009)
国家自然科学基金项目(No.61262066)
新疆师范大学重点实验室开放课题(No.WLYQ2013205)
-
文摘
维吾尔语词性标注是维吾尔语短语分析和句法分析必不可少的环节及其信息处理研究的重要工作,对维汉词典提供很好的基础。本论文首先介绍了词性标注的重要性及其它在自然语言信息处理工作中的作用,然后进行了现代维吾尔语动词语法语义相结合的动词词性标注标记集验证性研究,跟现有的现代维吾尔语动词标注标记集规范进行了比较,验证和补充,最后进行统计找出了每一种动词的词种数和频次。
-
关键词
维吾尔语
动词
词性标注标记集
验证性研究
-
分类号
H215
[语言文字—少数民族语言]
-