维吾尔语动词体范畴的有限状态自动机的构建被引量：4

Generating the Finite State Machines of Uyghur Verb Aspect Categories

下载PDF

导出

摘要维吾尔语动词的体范畴是维吾尔语动词语法范畴中极为复杂的范畴,也是维吾尔语信息处理中的难点问题之一,计算机对维吾尔语动词体范畴的处理是在对人称、时、否定等语法范畴处理之后才进行处理。但是难点就是体范畴重叠问题的解决。维吾尔语动词的体范畴词尾按照一定的规则连接在词干,这使得维吾尔语动词体范畴的重叠形式可用有限状态自动机形式化描述。因此它根据重叠规则构造从右向左的非确定自动机,之后把从右向左方向的自动机转换成从左向右的非确定自动机,最后把非确定自动机转换成确定自动机来实现维吾尔语动词体范畴的形式化描述。 The verb aspect category is one of the most complicated categories in Uighur language and,thus,remains as one of the hardest problems in Uyghur language processing.Computer processing of verb aspect category can only be done after resolving the grammatical categories such as tense,person,negative in Uighur language.But overlapping of verb aspect is hard to crack.The verb aspect suffixes of Uighur language are attached to the verb stem according to specific rules,which enables to describe the overlapping forms of Uyghur verb aspect in terms of finite state machine.An FSM can be firstly generated from right to left according to overlapping rules,then it can be transformed into DFA from left to right,during which the formal description of Uyghur verb aspect is realized.

作者阿孜古丽.夏力甫早克热.卡德尔吐尔根.依布拉音

机构地区新疆大学人文学院新疆大学计算机科学与技术博士后流动站新疆大学信息科学与工程学院

出处《中文信息学报》 CSCD 北大核心 2012年第4期61-65,84,共6页 Journal of Chinese Information Processing

基金 2011年度教育部人文社会科学青年基金资助项目(11YJC740001) 国家社会科学基金资助项目(10AYY006) 新疆维吾尔自治区普通高等学校人文社会科学重点研究基地基金资助项目(010812B04)

关键词维吾尔语动词体范畴有限状态自动机形式化 Uyghur language verb aspect category,finite state machine,formalization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1吐尔迪·艾合买提.维吾尔语[M].新疆:人民出版社,1981,716.
2哈米提·铁木尔.现代维吾尔语语法[M].北京:民族出版社,1987:246-248.
3蒲泉,武致中.实用维吾尔语语法[M].新疆:人民出版社,1994,155.
4刘珉.汉维共时语法[M].新疆:人民出版社,1991,143-155.
5木哈白提·哈斯木,哈力克·尼亚孜.现代维吾尔语动词体语缀的重叠与分布[J].民族语文,1996(1):57-60. 被引量：3
6木哈白提,哈力克.现代维语动词语缀─wεt、─wal－wεr、－ala、－wat探析[J].语言与翻译,1996(2):12-15. 被引量：1
7L. S. Larkey, L. Ballesteros, M. E. Connell. Impro- ving Stemming for Arabic Information Retrieval: Light Stemming and Co-occurrence Analysis [C]// Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Tampere, Finland, Aug. 2002: 275-282.
8Greengrass M. , Robertson A. M. , Robyn S. , et al. Processing morphological variants in searches of Latin text[J]. Information Research News, 1996, 6 (4) : 2-5.
9Berlian V. , Vega S. N. , Bressan S. Indexing the In- donesian web: Language identification and miscellane- ous issues [C]//Proceedings of 10th International World Wide Web Conference, Hong Kong, 2001.
10G. Eryigit & E. Adah. An Affix Stripping Morpho- logical Analyzer for Turkish[C]//Proceedings of the IASTED International Conference ARTIFICIAL IN- TELLIGENCE AND APPLICATIONS, 2004, Inns- bruck, Austria.

二级参考文献15

1古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
2力提甫.托乎提.电脑处理维吾尔语语音和谐律的可能性[J].中央民族大学学报（哲学社会科学版）,2004,31(5):108-113. 被引量：14
3阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：23
4L. S. Larkey, L. Ballesteros and M. E. Connell. Improving Stemming for Arabic Information Retrieval: Light Stemming and Co-occurrence Analysis[C]//Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval, Tampere, Finland,2002, 275-282.
5Tai, S. Y., Ong, C. S., and Abdullah, N. A. On designing an automated Malaysian stemmer for the Malay language(poster) [C]//Proeeedings of the fifth international workshop on information retrieval with Asian languages, Hong Kong, 2000: 207-208.
6Greengrass, M., Robertson, A. M., Robyn, S., and Willett, P. Processing morphological variants in searches of Latin text [J]. Information research news, 1996, 6(4): 2-5.
7Berlian, V., Vega, S. N., and Bressan, S. Indexing the Indonesian web: Language identification and miscellaneous issues[C]//Presented at Tenth International World Wide Web Conference, Hong Kong, 2001.
8Carlberger, J., Dalianis, H., Hassel, M., and Knutsson, O. Improving precision in information retrieval for Swedish using stemming[C]//Proceedings of NO- DALIDA'01-13th Nordic conference on computational linguistics, Uppsala,Sweden, 2001.
9Monz, C. and de Rijke, M. Shallow morphological analysis in rnonolingual information retrieval for German and Italian[C]//Cross-qanguage information retrieval and evaluation: Proceedings of the CLEF 2001 workshoo, C. Peters, Ed.: Soringer Verlag. 2001.
10G. Eryigit & E. Adal I. An Affix Stripping Morphological Analyzer for Turkish [C]//Proceedings of the lasted International Conference Artificial Iintelligence Applications, Innsbruck, Austria, 2004.

共引文献32

1吾买尔江.库尔班.现代维吾尔语动词时体范畴及其时间指向功能[J].语言与翻译,2007(1):9-15. 被引量：3
2阿孜古丽.夏力甫.汉语定中短语V N的维吾尔语对应表达[J].新疆大学学报（哲学社会科学版）,2008,36(2):148-152.
3阿孜古丽.夏力甫.维吾尔语动词附加语素的复杂特征研究[J].中文信息学报,2008,22(3):105-109. 被引量：8
4玉素甫.艾白都拉,阿不都热依木.沙力,阿拉帕提古丽.信息处理用维语词汇标注标记集的确定[J].计算机应用,2009,29(7):2006-2008. 被引量：4
5李遐.主观性与维吾尔语时范畴[J].语言与翻译,2011(1):38-42. 被引量：6
6卡依沙尔.艾合买提.维吾尔语心理动词的分类及其句法、语义分析[J].喀什师范学院学报,2011,32(1):45-48.
7阿孜古丽.夏力甫.论维吾尔语SUBS+NP结构的形式化描述[J].中文信息学报,2011,25(2):117-121. 被引量：2
8黄千,陈笑蓉,倪利华.水书字音编码研究[J].贵州大学学报（自然科学版）,2011,28(4):59-64. 被引量：2
9麦热哈巴.艾力,姜文斌,吐尔根.依布拉音.维吾尔语词法中音变现象的自动还原模型[J].中文信息学报,2012,26(1):91-96. 被引量：8
10阿力木江·艾沙,吐尔根·依布拉音,艾山·吾买尔,马尔哈巴·艾力.基于机器学习的维吾尔文文本分类研究[J].计算机工程与应用,2012,48(5):110-112. 被引量：20

同被引文献42

1古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
2马欢,吾守尔.斯拉木.维吾尔语文语转换系统文本分析模块初探[J].计算机工程,2006,32(16):267-268. 被引量：6
3王斯日古楞.蒙古语单词词性自动识别研究[J].内蒙古师范大学学报（自然科学汉文版）,2007,36(3):319-321. 被引量：2
4哈密提·铁木尔.现代维吾尔语语法[M].北京:民族出版社,1987.
5SZARVAS M,FURUI S.Finite State Transducer basedModeling of Morphosyntax with Application to HungarianLVCSR [C] // ICASSP 2003.[ s.l.]:ConferencePublications,2003:368-371.
6HIRSIMAKI T,CREUTZ M,SIIYOLA V,et al.Unlim-ited Vocabulary Speech Recognition with Morph LanguageModels Applied to Finnish [ J].Computer Speech andLanguage,2006,20(4):515-541.
7KWON O,PARK J.Korean Large Vocabulary Continu-ous Speech Recognition with Morpheme-based Recogni-tion Units [ J].Speech Communication,2003,39(3-4):287-300.
8HACIOGLU K,PELLOM B.On Lexicon Creation forTurkish LVCSR [ C] // Eurospeech 2003.[s.l.]:Conference Publications,2003:1165-1168.
9ARISOY E,DUTAGACI H,ARSLAN L M.A UnifiedLanguage Model for Large Vocabulary Continuous SpeechKecognition of Turkish [J].Signal Process,2006,86(10):2844-2862.
10SAK H,SARAgLAR M,GUNGOR T. Morphology-basedand Suh-wonl Language Modeling for Turkish SpeechRecognition [ C].// ICASSP 2010.[ s.l.]:Confer-ence Publications,2010:5402-5405.

引证文献4

1李鑫,侯炜,计哲,潘接林,颜永红.面向维吾尔语电话交谈式语音识别的词典设计方法研究[J].重庆邮电大学学报（自然科学版）,2013,25(3):391-396. 被引量：1
2陈科海,周喜,杨雅婷,米成刚.基于粘着性模糊规则的维汉机器翻译最大熵调序研究[J].计算机应用研究,2013,30(9):2587-2590. 被引量：2
3伊力亚尔.达吾提,哈力旦.阿布都热依木,杨娜娜.面向维吾尔文的多模式匹配算法研究[J].计算机工程,2015,41(1):143-149. 被引量：1
4斯.劳格劳.蒙古语固定短语识别算法的设计与实现[J].中文信息学报,2017,31(5):85-91. 被引量：3

二级引证文献7

1孙瑞.基于英语翻译应用视角下的计算机智能校对系统开发研究[J].微型电脑应用,2020,36(2):145-148. 被引量：6
2董滨,丁铭,王磊,颜永红.面向双语教学的维吾尔语发音质量自动评估[J].中国科学：信息科学,2015,45(10):1328-1340.
3李晓,蒋同海,周喜,王磊,杨雅婷.维汉机器翻译关键技术研究概述[J].网络新媒体技术,2016,5(1):19-25. 被引量：1
4崔丹.英语翻译计算机智能校对系统设计[J].现代电子技术,2019,42(4):179-182. 被引量：12
5伊力亚尔·达吾提.维吾尔文本处理中多模式匹配的应用[J].电脑知识与技术,2019,15(6):210-211.
6田力.基于汉英短语翻译组合机器自动翻译系统设计与测试研究[J].微型电脑应用,2020,36(5):43-46. 被引量：10
7哈里旦木·阿布都克里木,侯钰涛,姚登峰,阿布都克力木·阿布力孜,陈吉尚.维吾尔语机器翻译研究综述[J].计算机工程,2024,50(1):1-16. 被引量：1

1阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：23
2曾守桢,张崇辉.从大数据看综合评价“”[J].中国统计,2014,0(9):51-52.
3张雪琳.关于俄语副动词的几个问题[J].黑龙江科技信息,2009(22):174-174.
4印桂生,沈洁,谢晓芹.确定自动机上的XML数据过滤算法改进[J].哈尔滨工程大学学报,2011,32(3):328-333.
5帕提古力.依马木,买合木提.买买提,吐尔根.依布拉音,卡哈尔江.阿比的热西提.基于感知器算法的维吾尔语词性标注研究[J].中文信息学报,2014,28(5):187-191. 被引量：4
6聂志平,杨文全.从同一性看量词与名量兼类[J].励耘语言学刊,2015(1):40-47.
7赛迪亚古丽.艾尼瓦尔,向露,宗成庆,艾克白尔.帕塔尔,艾斯卡尔.艾木都拉.融合多策略的维吾尔语词干提取方法[J].中文信息学报,2015,29(5):204-210. 被引量：12
8高玉兰,刘磊,金成植.对语法分析程序自动生成器YACC的改进[J].吉林大学自然科学学报,1992(2):36-41.
9虞蕾,陈火旺.PSL构造双向交换自动机及非确定自动机的方法[J].软件学报,2010,21(1):34-46.
10龙文,辛阳,杨义先.基于位并行技术的特殊字符串匹配[J].武汉理工大学学报,2009,31(6):109-113.

中文信息学报

2012年第4期

浏览历史

内容加载中请稍等...

维吾尔语动词体范畴的有限状态自动机的构建被引量：4

参考文献14

二级参考文献15

共引文献32

同被引文献42

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

维吾尔语动词体范畴的有限状态自动机的构建 被引量：4

参考文献14

二级参考文献15

共引文献32

同被引文献42

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

维吾尔语动词体范畴的有限状态自动机的构建被引量：4