基于形态分析的现代维吾尔语名词词干识别研究被引量：4

Morphological Analysis Based Noun Stem Identification for Modern Uyghur

下载PDF

导出

摘要现代维吾尔语名词词干识别是自然语言处理领域的重要基础性研究,主要目的是从句子中提取名词词干,提高名词识别效率。首先陈述形态分析概念,通过这些形态特征可以准确地识别其词性的意义;其次讨论维吾尔语的词类划分标准、名词的形态特征分析,总结词缀歧义及消解规则;该文提出研究总体思路,设计现代维吾尔语新词中名词识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等;最后将初中、高中物理维吾尔语教材作为验证对象,对名词词干进行统计与分析。 Modern Uyghur noun stem identification is a fundamental issue in the field of natural language processing. The morphological analysis is first introduced, especially on its role in identifying the POS of words. Then this paper describes the POS scheme in Uyghur, as well as the morphological characteristics of Uyghur nouns, suffix ambiguity and the disambiguation rules. The algorithm of new nouns identification in modern Uyghur language is pro posed, including feature selection （features within and between words） and parameter estimation. The experiment is carried on the corpus of Uyghur physical textbooks in junior and senior middle schools.

作者艾孜尔古丽阿力木.木拉提玉素甫.艾白都拉

机构地区新疆师范大学计算机科学与技术学院中国科学院新疆理化技术研究所

出处《中文信息学报》 CSCD 北大核心 2015年第6期208-212,共5页 Journal of Chinese Information Processing

基金新疆维吾尔自治区自然科学基金(2014211A045) 新疆维吾尔自治区哲学社会科学研究规划基金(14CYY093) 教育部人文社会科学一般项目(14YJC740001) 新疆维吾尔自治区高校科研计划青年教师科研启动基金(20140706213103147) 国家自然科学基金(61132009 61262066) 国家社科基金(14AZD11)

关键词现代维吾尔语形态分析名词词干识别 modern Uyghur morphological analysis noun stems recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1赵岩,王晓龙,刘秉权,关毅.融合聚类触发对特征的最大熵词性标注模型[J].计算机研究与发展,2006,43(2):268-274. 被引量：20
2赵伟,赵法兴,王东海,韩达奇.一种基于改进的最大熵模型的汉语词性自动标注的新方法[J].计算机研究与发展,2006,43(z3):174-178. 被引量：3
3玉素甫.艾白都拉,张海军,艾孜尔古丽.信息处理用现代维吾尔语词干词类标记集研究[J].信息技术与标准化,2011(6):45-48. 被引量：8
4艾孜尔古丽,努尔艾合买提,玉素甫.艾白都拉.现代维吾尔语常用词统计关键技术研究[J].中文信息学报,2014,28(5):192-197. 被引量：8
5艾孜尔古丽,艾山江.阿不力孜,玉素甫.艾白都拉.现代维吾尔文网络媒体用词研究[J].计算机应用与软件,2012,29(2):67-68. 被引量：7
6艾孜尔古丽,齐向卫,玉素甫.艾白都拉.基于网站用词调查的现代维吾尔语词干提取和应用研究[J].计算机应用与软件,2012,29(3):32-34. 被引量：11
7玉素甫.艾白都拉,艾孜尔古丽.基于网站用词调查的现代维吾尔语词尾切分和应用研究[J].计算机应用与软件,2012,29(4):13-15. 被引量：6
8玉素甫.艾白都拉,艾孜尔古丽,祖丽皮亚.基于网站用词调查的现代维吾尔语词长研究[J].计算机应用与软件,2012,29(5):32-34. 被引量：9
9苏新春,杨尔弘.2005年度汉语词汇统计的分析与思考[J].厦门大学学报（哲学社会科学版）,2006,56(6):84-91. 被引量：13

二级参考文献62

1苏新春.关于《现代汉语词典》词汇计量研究的思考[J].世界汉语教学,2001,15(4):39-47. 被引量：19
2玉素甫.艾白都拉,阿布都热依木.沙力.现代维语语料库的词类标注研究[J].民族语文,2005(4):63-66. 被引量：7
3苏新春.对外汉语词汇大纲与两种教材词汇状况的对比研究[J].语言文字应用,2006(2):103-111. 被引量：37
4苏新春,杨尔弘.2005年度汉语词汇统计的分析与思考[J].厦门大学学报（哲学社会科学版）,2006,56(6):84-91. 被引量：13
5[2]Chen Wenliang,Chang Xingzhi,Wang Huizhen,et al.Automatic word clustering for text categorization using global information.AIRS2004,Beijing,2004
6[3]Adwait Ratnaparkhi.A maximum entropy model for part-of-speech tagging.Conf on Empirical Methods in Natural Language Processing,University of Pennsylvania,1996
7[4]Steven J Benson,Jorge J More.A limited-memory variable-metric method for bound-constrained minimization.Mathematics and Computer Science Division,Argonne National Laboratory,Tech Rep ANL/MCS-P909-0901,2001
8[5]Stanley F Chen,Ronald Rosenfeld.A Gaussian priori for smoothing maximum entropy models.Computer Science Department,Carnegie Mellon University,Tech Rep CMU-CS-99-108,1999
9[6]Fabrizio Sebastiani.Machine learning in automated text categorization.ACM Computing Surveys,2000,34(1):1-47
10[7]Jinying Chen,NianWen Xue,Martha Palmer.Using a smoothing maximum entropy model for chinese nominal entity tagging.The 1st Int'l Joint Conf on Natural Language Processing,Hainan Island,2004

共引文献54

1巴哈古丽·图尼亚孜,玉素甫·艾拜都拉.维吾尔语词频统计系统研究[J].电子世界,2020(3):63-64.
2于江德,周宏宇,余正涛.基于单个词语特征模板的汉语词性标注[J].山西大学学报（自然科学版）,2011,34(4):513-517. 被引量：1
3姜维,关毅,王晓龙.基于条件随机域的词性标注模型[J].计算机工程与应用,2006,42(21):13-16. 被引量：12
4曾小兵,张志平,刘荣,杨尔弘,张普.《中国语言生活状况报告》中成语与习语的调查与思考[J].中文信息学报,2008,22(6):43-49. 被引量：4
5刘云.汉语词汇统计研究述评[J].汉语学习,2009(1):62-69. 被引量：6
6盛振华,吴羽,江锦华,寿黎但,陈刚.InfoSigs:一种面向Web对象的细粒度聚类算法[J].计算机研究与发展,2010,47(5):796-803. 被引量：4
7于江德,李学钰,樊孝忠,庞文博.最大熵模型的事件分类[J].电子科技大学学报,2010,39(4):612-616. 被引量：7
8吴羽,盛振华,寿黎但,陈刚.TrigSigs:一种有效的非结构化记录关联合并算法[J].浙江大学学报（工学版）,2010,44(12):2284-2290.
9刘晨晨,徐一新.长尾理论视角下基于DCA的网络自助出版推荐系统[J].计算机系统应用,2011,20(7):26-30. 被引量：2
10张贯虹,斯.劳格劳,乌达巴拉.融合形态特征的最大熵蒙古文词性标注模型[J].计算机研究与发展,2011,48(12):2385-2390. 被引量：10

同被引文献57

1陈世明.试论维吾尔语部分词尾的演变[J].西北民族研究,1989(1):234-240. 被引量：1
2霍盛.试论维吾尔语形态变化的功能及其特点[J].新疆大学学报（哲学社会科学版）,1991,23(3):104-111. 被引量：3
3古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
4力提甫.托乎提.电脑处理维吾尔语语音和谐律的可能性[J].中央民族大学学报（哲学社会科学版）,2004,31(5):108-113. 被引量：14
5阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：23
6玉素甫.艾白都拉,吾守尔.斯拉木,赛依提.阿不都拉.维语词法分析器研究成功[J].中文信息,1997,14(4):31-35. 被引量：5
7玛依热.依布拉音,米吉提.阿不里米提,艾斯卡尔.艾木都拉.基于最小编辑距离的维语词语检错与纠错研究[J].中文信息学报,2008,22(3):110-114. 被引量：11
8米热古丽.艾力,米吉提.阿不力米提,艾斯卡尔.艾木都拉.基于词法分析的维吾尔语元音弱化算法研究[J].中文信息学报,2008,22(4):43-47. 被引量：17
9魏顺平,傅骞,何克抗.低年级小学生用字情况调查与分析——以广东、北京两地6所小学为例[J].语言文字应用,2008(3):81-89. 被引量：9
10早克热·卡德尔,吐尔根·依布拉音.维吾尔语形容词构形词缀有限状态自动机[J].电脑知识与技术,2009,5(2):939-941. 被引量：4

引证文献4

1艾孜尔古丽,艾孜海尔江,玉素甫.艾白都拉,祖力克尔江,米尔夏提.维吾尔文初中数学教材词干分析研究[J].中文信息学报,2017,31(5):108-113. 被引量：1
2哈里旦木·阿布都克里木,孙茂松,刘洋,阿布都克力木·阿布力孜.THUUyMorph：维吾尔语形态切分语料库[J].中文信息学报,2018,32(2):81-86. 被引量：5
3古丽尼格尔·阿不都外力,吐尔根·依布拉音,卡哈尔江·阿比的热西提,王路路.基于Bi-LSTM-CRF模型的维吾尔语词干提取的研究[J].中文信息学报,2019,33(8):60-66. 被引量：6
4刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3

二级引证文献11

1赖玉金.“STEM”视角下的初中数学教学方法研究[J].数学学习与研究,2019,0(23):57-57. 被引量：4
2瓦依提·阿不力孜,加米拉·吾守尔,吐尔根·依不拉音.基于词缀附加引擎的维吾尔语名词词干提取研究[J].电视技术,2019,43(20):5-10.
3吾买尔江·买买提明,古丽尼格尔·阿不都外力,买合木提·买买提,卡哈尔江·阿比的热西提,吐尔根·依布拉音.乌兹别克语词干提取算法的比较研究[J].中文信息学报,2020,34(1):45-50. 被引量：2
4艾山·吾买尔,斯拉吉艾合麦提·如则麦麦提,西热艾力·海热拉,刘文其,吐尔根·依布拉音,汪烈军,瓦依提·阿不力孜.带标记音节的双向维汉神经机器翻译方法[J].计算机工程与应用,2021,57(4):161-168. 被引量：3
5买买提・许库尔,艾孜尔古丽.现代维吾尔语句子资源库构建研究[J].信息与电脑,2021,33(5):204-207.
6刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3
7阿布都克力木·阿布力孜,刘畅,哈里旦木·阿布都克里木,郭文强.融合字符串特征的维吾尔语形态切分[J].计算机仿真,2022,39(7):257-262. 被引量：1
8阿孜古丽·夏力甫,王紫悦.基于句法语义的维吾尔语捆绑类手部动词词网建设[J].喀什大学学报,2023,44(2):55-63.
9张雨宁,李文卓,哈里旦木·阿布都克里木,阿布都克力木·阿布力孜.维吾尔语形态切分的元学习方法[J].计算机工程与应用,2023,59(11):98-104.
10古再力努尔·依明,米吉提·阿不里米提,哈妮克孜·伊拉洪,艾斯卡尔·艾木都拉.面向音素序列的黏着语词干提取研究[J].小型微型计算机系统,2023,44(10):2362-2368.

1艾孜尔古丽,齐向卫,玉素甫.艾白都拉.基于网站用词调查的现代维吾尔语词干提取和应用研究[J].计算机应用与软件,2012,29(3):32-34. 被引量：11
2艾孜尔古丽,努尔艾合买提,玉素甫.艾白都拉.现代维吾尔语常用词统计关键技术研究[J].中文信息学报,2014,28(5):192-197. 被引量：8
3早克热.卡德尔,艾山.吾买尔,吐尔根.依布拉音,帕里旦.吐尔逊,吴小川.混合策略的维吾尔语名词词干提取系统[J].计算机工程与应用,2013,49(1):171-175. 被引量：11
4艾孜尔古丽,米尔夏提,玉素甫.艾白都拉.现代维吾尔语词干词类标注标记集验证性研究[J].计算机工程与科学,2015,37(12):2318-2323. 被引量：2
5刘练珍,张向阳.图灵机概念的教学思考[J].科技创新导报,2016,13(29):162-163.
6隆萍,刘兴莉,刘琴.可靠性信息分析探讨[J].自动化与仪器仪表,2016(3):226-227. 被引量：2
7张建宇.后DVR时代来临视频监控产品的市场分析[J].A&S（安全&自动化）,2008(3):122-125.
8玉素甫.艾白都拉,艾孜尔古丽,祖丽皮亚.基于网站用词调查的现代维吾尔语词长研究[J].计算机应用与软件,2012,29(5):32-34. 被引量：9
9努尔比亚.买买提,栾静.数据库在词频统计中的应用[J].计算机光盘软件与应用,2014,17(4):119-120.
10牛洪梅,加米拉.吾守尔,吐尔根.依布拉音.现代维吾尔语的词性标注校对技术研究[J].伊犁师范学院学报（自然科学版）,2007,1(1):43-46. 被引量：2

中文信息学报

2015年第6期

浏览历史

内容加载中请稍等...

基于形态分析的现代维吾尔语名词词干识别研究被引量：4

参考文献9

二级参考文献62

共引文献54

同被引文献57

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于形态分析的现代维吾尔语名词词干识别研究 被引量：4

参考文献9

二级参考文献62

共引文献54

同被引文献57

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于形态分析的现代维吾尔语名词词干识别研究被引量：4