基于功能词缀串的维吾尔语词性标注方法被引量：8

The Uyghur POS-Tagging Method Based on Functional Suffix Strings

下载PDF

导出

摘要维吾尔语作为一种典型的黏着语,通过丰富的功能词缀来表达各种语法和语气。该文探讨了"词干词性标注方法"与"词缀词性标注方法"在维吾尔语自然语言处理中的优缺点。在大规模语料库中,统计了常用词缀串的数量、频次和覆盖度,以此来判断词缀词性标注方法在自然语言处理中的可行性。以力提甫·托乎提教授的维吾尔语生成语法理论为指导,对词缀串的词性标注进行了相应的语法定义,并且在实际语料中进行了小规模词性标注实验。该文提出的基于词缀串的词性标注方法不仅适用于维吾尔语,也适用于有着大量相似词缀的突厥语族其他语言。 As a typical agglutinative language,Uyghur have rich suffixes to express syntax and mood.This paper contrast two kinds of POS-Tagging method in Uyghur language processing：one is POS-Tagging based on the stem words,the other is based on the suffixes.We statistics the sum,the frequency,and the cover degree of common functional suffix strings in a big corpus,aim to judge the feasibility of POS-Tagging method based on suffix strings.We define the regulation of suffix POS-Tagging based on the theory of Prof.Litip Tohti and label some corpus based on this kind of POS-Tagging definition,which is not only useful to Uyghur,but also to other Turkic languages which have much similar suffixes.

作者王海波祖漪清力提甫.托乎提

机构地区中国社科院民族学与人类学研究所中央民族大学维吾尔语言文学系安徽科大讯飞科技股份有限公司

出处《中文信息学报》 CSCD 北大核心 2013年第5期179-183,共5页 Journal of Chinese Information Processing

关键词维吾尔语词缀串词性标注 Uyghur suffix strings POS-Tagging

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1吐尔根·依不拉音,阿里甫·库尔班.基于词典的现代维吾尔语词性自动标注系统的研究[C]//中文输入技术发展历程及输入方案汇编(论文集),2006,11.
2哈里旦木.阿布都克里木,吐尔根.依布拉音,帕力旦.吐尔逊,艾山.吾买尔,阿布都热依木.热合曼,阿布都克力木.阿不力孜.基于短语结构语法的维吾尔语规则库建设[J].现代计算机,2010,16(5):30-33. 被引量：2
3阿里甫.库尔班,吾买尔江.库尔班,吐尔根.伊布拉音.面向信息处理的维吾尔语词语分类体系及标记研究(Ⅱ)[J].新疆大学学报（自然科学版）,2010,27(1):106-112. 被引量：7
4努尔比娅.塔依尔,地里木拉提.吐尔逊,艾斯卡尔.肉孜.面向韵律层边界自动划分的维吾尔语词性自动标注技术研究[J].计算机应用与软件,2011,28(8):165-168. 被引量：1
5尼加提·纳吉米,买合木提·买买提,吐尔根·依布拉音.基于N元模型的维吾尔语词性标注实验研究[J].计算机工程与应用,2012,48(25):137-140. 被引量：2

二级参考文献25

1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
2牛洪梅,吐尔根,伊不拉音.维吾尔语的词性标注校对初探[J].微型电脑应用,2006,22(12):45-47. 被引量：1
3哈密提·铁木尔.现代维吾尔语语法[M].北京:民族出版社,1987.
4Chafe Wallace L. Meaning and Structure of Language[M]. Chicago, The University of Chicago Press, 1970, 97.
5哈米提·铁木尔.现代维吾尔语语法·形态学[M].北京:民族出版社,1987.
6刘开瑛郑家恒赵军.语料库词类自动标注方法算法研究.机器翻译研究进展,1992,:378-386.
7Leech. Geoffrey Corpus annotation schemes[J]. Literary and Linguistic Computing, 1993, 8(4): 275-469.
8力提甫·托合提.阿尔泰语言的句法结构.中国人民大学出版社,2004.
9俞士汶.计算语言学[M].商务印书馆,2003.
10刘群.自然语言理解[M].电子工业出版社,2005.

共引文献8

1塔依尔.阿不都外力,艾山.吾买尔,吐尔根.伊布拉音,张健.基于标注词典和规则的维吾尔文动词词干提取方法[J].新疆大学学报（自然科学版）,2013,30(1):6-1. 被引量：3
2谭勋,吐尔根·依布拉音,艾山·吾买尔,张韦煜.基于相似度计算的维吾尔语词聚类[J].新疆大学学报（自然科学版）,2012,29(1):104-107. 被引量：2
3秦春香,黄浩,哈力旦·阿不都热依木.基于音位学特征的维吾尔语声学建模[J].新疆大学学报（自然科学版）,2012,29(3):345-349. 被引量：1
4阿里甫.库尔班,吾买尔江.库尔班,房鼎益.维吾尔语框架语义角色标注标记集研究[J].中文信息学报,2013,27(2):41-46. 被引量：1
5米热吉古丽.热扎克,阿里甫.库尔班.维吾尔语框架语义例句辅助标注系统的设计与实现[J].新疆大学学报（自然科学版）,2014,31(4):475-480.
6艾孜尔古丽,米尔夏提,玉素甫.艾白都拉.现代维吾尔语词干词类标注标记集验证性研究[J].计算机工程与科学,2015,37(12):2318-2323. 被引量：2
7吐尔根.依布拉音,卡哈尔江.阿比的热西提,艾山.吾买尔,买合木提.买买提.中亚语言自然语言处理综述[J].中文信息学报,2018,32(5):1-13. 被引量：6
8费德莲,袁凌云,权朝臣.面向信息处理的少数民族语料库构建分析[J].无线互联科技,2019,16(19):77-79. 被引量：2

同被引文献83

1张黎,陈振魁.新疆维吾尔网络语言的文字使用特点研究[J].南昌教育学院学报,2012,27(8):178-179. 被引量：3
2高莉琴.维语一些句子的深层结构和转换[J].新疆大学学报（哲学社会科学版）,1986,18(2):103-108. 被引量：1
3高莉琴.维吾尔语中的空语类[J].新疆大学学报（社会科学版）,2004,32(3):122-125. 被引量：2
4玉素甫.艾白都拉,阿布都热依木.沙力.现代维语语料库的词类标注研究[J].民族语文,2005(4):63-66. 被引量：7
5陈鹏,古丽拉.阿东别克.隐马尔可夫模型在维吾尔语词性标注中的应用[J].电脑知识与技术,2006,1(4):127-128. 被引量：1
6阿依克孜.卡德尔.维吾尔语的几种特殊空位[J].中央民族大学学报（哲学社会科学版）,2006,33(3):112-116. 被引量：2
7洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
8潘艳兰.浅析维吾尔语疑问句的深层句法结构[J].语言与翻译,2007(3):32-36. 被引量：3
9阿巴拜克热.买买提.从转换生成语法角度考察现代维吾尔语格附加成分叠加[J].语言与翻译,2008(2):17-20. 被引量：2
10达吾勒.阿布都哈依尔,古丽拉.阿东别克.哈萨克语词法分析器的研究与实现[J].计算机工程与应用,2008,44(19):146-149. 被引量：16

引证文献8

1帕丽旦.木合塔尔,吾守尔.斯拉木,买买提阿依甫.基于混合模型的维吾尔文词性标注方法[J].计算机仿真,2019,36(1):268-273. 被引量：6
2张海军.维吾尔语短语自动抽取研究进展[J].计算机科学与探索,2015,9(12):1420-1429. 被引量：3
3袁蕾.三十年来维吾尔语生成语法研究综述[J].贵州民族研究,2016,37(11):217-220.
4李萍,杨勇,赛买提.艾力,任鸽.基于HMM的维吾尔语词性标注研究[J].现代计算机,2017,23(5):11-14. 被引量：1
5吐尔根.依布拉音,卡哈尔江.阿比的热西提,艾山.吾买尔,买合木提.买买提.中亚语言自然语言处理综述[J].中文信息学报,2018,32(5):1-13. 被引量：6
6帕提曼·艾克木.浅谈现代维吾尔语的歧义短语[J].当代教研论丛,2017,0(3):24-24.
7依不拉音.吾斯曼,张绍武,于凯.互联网上的维语多文转换机制的设计与实现[J].计算机工程与应用,2018,54(19):114-121. 被引量：1
8赵一江,余超,于清.适用于少数民族的Unity3d虚拟仿真系统关键技术研究[J].现代电子技术,2023,46(23):133-136.

二级引证文献17

1冯秋燕,朱学芳.基于科学计量的信息技术融合分析[J].情报科学,2020,0(2):142-150. 被引量：4
2冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
3贾钰峰,章蓬伟,邵小青,张玉茜.印刷维吾尔文识别后处理[J].智能计算机与应用,2020(4):239-242.
4帕提曼·艾克木.浅谈现代维吾尔语的歧义短语[J].当代教研论丛,2017,0(3):24-24.
5丘心颖,陈汉武,陈源,谭立聪,张皓,肖莉娴.融合Self-Attention机制和n-gram卷积核的印尼语复合名词自动识别方法研究[J].湖南工业大学学报,2020,34(3):1-9. 被引量：2
6孔祥鹏,吾守尔·斯拉木,杨启萌,李哲.基于迁移学习的维吾尔语命名实体识别[J].东北师大学报（自然科学版）,2020,52(2):58-65. 被引量：10
7买买提・许库尔,艾孜尔古丽.现代维吾尔语句子资源库构建研究[J].信息与电脑,2021,33(5):204-207.
8耿立波,酆格斐,詹卫东,杨亦鸣.中国计算语言学研究现状与展望[J].语言科学,2021,20(5):491-499. 被引量：3
9莫礼平,胡美琪,唐琰.湘西苗文词性标注知识库系统的构建[J].电脑知识与技术,2021,17(31):9-12. 被引量：1
10莫礼平,黄永琨.基于FP-Growth算法的词性标注规则获取方法[J].吉首大学学报（自然科学版）,2021,42(4):38-43.

1李萍,杨勇,赛买提.艾力,任鸽.基于HMM的维吾尔语词性标注研究[J].现代计算机,2017,23(5):11-14. 被引量：1
2帕提古力.依马木,买合木提.买买提,吐尔根.依布拉音,卡哈尔江.阿比的热西提.基于感知器算法的维吾尔语词性标注研究[J].中文信息学报,2014,28(5):187-191. 被引量：4
3尼加提·纳吉米,买合木提·买买提,吐尔根·依布拉音.基于N元模型的维吾尔语词性标注实验研究[J].计算机工程与应用,2012,48(25):137-140. 被引量：2
4帕力旦.吐尔逊,房鼎益.融合形态特征的最大熵维吾尔语词性标注[J].西北大学学报（自然科学版）,2015,45(5):721-726. 被引量：1
5李晓,蒋同海,周喜,王磊,杨雅婷.面向复杂形态语言机器翻译的多模型融合词性标注研究[J].网络新媒体技术,2014,3(1):60-64. 被引量：1
6陈小莹.基于词典库的藏文黏着语规范化处理研究[J].西藏科技,2016(10):27-28.
7陈小莹.现代藏文中黏着语的规范化处理[J].电脑与信息技术,2017,25(1):17-19.
8陈鹏,古丽拉.阿东别克.隐马尔可夫模型在维吾尔语词性标注中的应用[J].电脑知识与技术,2006,1(4):127-128. 被引量：1
9牛洪梅,加米拉.吾守尔,吐尔根.依布拉音.现代维吾尔语的词性标注校对技术研究[J].伊犁师范学院学报（自然科学版）,2007,1(1):43-46. 被引量：2
10哈里旦木.阿布都克里木,吐尔根.依布拉音,帕力旦.吐尔逊,艾山.吾买尔,阿布都热依木.热合曼,阿布都克力木.阿不力孜.基于短语结构语法的维吾尔语规则库建设[J].现代计算机,2010,16(5):30-33. 被引量：2

中文信息学报

2013年第5期

浏览历史

内容加载中请稍等...

基于功能词缀串的维吾尔语词性标注方法被引量：8

参考文献5

二级参考文献25

共引文献8

同被引文献83

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于功能词缀串的维吾尔语词性标注方法 被引量：8

参考文献5

二级参考文献25

共引文献8

同被引文献83

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于功能词缀串的维吾尔语词性标注方法被引量：8