摘要
句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分析算法;探索现代维吾尔语谓语的识别算法设计、其他句子成分的识别、自动界定预测算法等研究现代维吾尔语句子成分分析问题;解决现代维吾尔语句子成分分析系统实现、实验数据分析等现代维吾尔语句子成分分析问题。
Sentence component analysis is important and difficult in natural language processing. We first discuss component division problems of single sentences in modern Uyghur, including the relationship between modern Uyghur phrases and sentences and the relationship among the parts of speech. We then discuss the pretreatment of the modern Uyghur corpus, phrase tag sets, the basic idea of dividing sentence elements, and sentence component analysis algorithm. We further explore a recognition design for identifying modern Uyghur predicate elements, other sentence components, and automatical defining prediction algorithms to solve the problems of modern Uighur statement analysis and experiment data analysis.
出处
《计算机工程与科学》
CSCD
北大核心
2015年第12期2339-2344,共6页
Computer Engineering & Science
基金
教育部人文社会科学一般项目(14YJC740001)
新疆维吾尔自治区自然科学基金资助项目(2014211A045)
新疆维吾尔自治区哲学社会科学研究规划基金资助项目(14CYY093)
新疆维吾尔自治区高校科研计划青年教师科研启动基金资助项目(20140706213103147)
国家自然科学基金重点项目(61132009)
国家自然科学基金资助项目(61262066
61463048)
国家社科基金重点项目(14AZD11)
关键词
信息处理
维吾尔语
短语结构
句子成分
information processing
Uyghur words
phrase structure
sentence component