面向信息处理的少数民族语料库构建分析被引量：2

Analysis of the construction of minority corpus oriented to information processing

下载PDF

导出

摘要语料库是一切自然语言处理的基础,尤其是在机器翻译、语音识别等应用的大趋势下,构建高质量、大规模、标准化的语料库尤为重要。民族语料库构建工作自20世纪八九十年代起,到目前已取得众多成果。文章主要对我国民族语料库的建设现状及相关研究进行介绍与评价,重点分析蒙语、维语、藏语语料库研究工作,并在此基础上,针对民族语料库构建存在的问题提几点建议,以期为其他少数民族构建民族语料库提供借鉴与参考。 The corpus is the basis of natural language processing, especially in the trend of applications such as machine translation and speech recognition. It is important to build high quality, massive, standardized corpus. Since the 1980 s and 1990 s, the construction of the national corpus has achieved many achievements. This paper analysis the research status of the national corpus, focusing on the Mongolian, Uyghur and Tibetan corpus. And then, this paper puts forward some suggestions for the problems existing in the construction of national corpus, so as to provide reference for other ethnic minorities to build national corpus.

作者费德莲袁凌云权朝臣 Fei Delian;Yuan Lingyun;Quan Chaochen(Yunnan Normal University,Kunming 650500,China)

机构地区云南师范大学

出处《无线互联科技》 2019年第19期77-79,共3页 Wireless Internet Technology

关键词少数民族语语料库构建蒙语维语藏语 minority nationality language corpus construction Mongolian Uyghur Tibetan

分类号 H31 [语言文字—英语]

引文网络
相关文献

参考文献4

1阿里甫.库尔班,吾买尔江.库尔班,吐尔根.伊布拉音.信息处理维吾尔语词语分类体系及标记研究(Ⅰ)[J].新疆大学学报（自然科学版）,2009,26(4):476-481. 被引量：5
2玉素甫.艾白都拉,张海军,艾孜尔古丽.信息处理用现代维吾尔语词干词类标记集研究[J].信息技术与标准化,2011(6):45-48. 被引量：8
3李博涵,刘汇丹,龙从军,吴健.基于深度学习的藏文分词方法[J].计算机工程与设计,2018,39(1):194-198. 被引量：16
4阿里甫.库尔班,吾买尔江.库尔班,吐尔根.伊布拉音.面向信息处理的维吾尔语词语分类体系及标记研究(Ⅱ)[J].新疆大学学报（自然科学版）,2010,27(1):106-112. 被引量：7

二级参考文献21

1玉素甫.艾白都拉,阿布都热依木.沙力.现代维语语料库的词类标注研究[J].民族语文,2005(4):63-66. 被引量：7
2Greene, Barbara B, Rubin Geral M. Automated Grammatical Tagging of English, Brown University, 1971.
3Kucera H, Francis W Nelson. Frequency Analysis of English Usage: Lexicon and Grammar, Houghton-Mifflin Company, Boston, 1982.
4MarshaU Jan. Choice of Grammatical Word-Class Without Global Syntactic Analysis[J]. Computers in the Hmnanities, 1983, 17: 139-150.
5Shannon C. The Mathematical Theory of Communication[J]. Bell Sustem Technical Journal, 1948, 27: 398-403.
6刘开瑛,郑家恒,赵军.语料库词类自动标注方法算法研究[M].机器翻译研究进展,1992,378-386.
7哈米提·铁木尔.现代维吾尔语语法.形态学[M].北京:民族出版社,1987.
8Chafe Wallace L. Meaning and Structure of Language[M]. Chicago, The University of Chicago Press, 1970, 97.
9哈米提·铁木尔.现代维吾尔语语法·形态学[M].北京:民族出版社,1987.
10刘开瑛郑家恒赵军.语料库词类自动标注方法算法研究.机器翻译研究进展,1992,:378-386.

共引文献29

1塔依尔.阿不都外力,艾山.吾买尔,吐尔根.伊布拉音,张健.基于标注词典和规则的维吾尔文动词词干提取方法[J].新疆大学学报（自然科学版）,2013,30(1):6-1. 被引量：3
2谭勋,吐尔根·依布拉音,艾山·吾买尔,张韦煜.基于相似度计算的维吾尔语词聚类[J].新疆大学学报（自然科学版）,2012,29(1):104-107. 被引量：2
3秦春香,黄浩,哈力旦·阿不都热依木.基于音位学特征的维吾尔语声学建模[J].新疆大学学报（自然科学版）,2012,29(3):345-349. 被引量：1
4阿里甫.库尔班,吾买尔江.库尔班,房鼎益.维吾尔语框架语义角色标注标记集研究[J].中文信息学报,2013,27(2):41-46. 被引量：1
5王海波,祖漪清,力提甫.托乎提.基于功能词缀串的维吾尔语词性标注方法[J].中文信息学报,2013,27(5):179-183. 被引量：8
6艾孜尔古丽,努尔艾合买提,玉素甫.艾白都拉.现代维吾尔语常用词统计关键技术研究[J].中文信息学报,2014,28(5):192-197. 被引量：8
7米热吉古丽.热扎克,阿里甫.库尔班.维吾尔语框架语义例句辅助标注系统的设计与实现[J].新疆大学学报（自然科学版）,2014,31(4):475-480.
8李连倍,刘胜全,刘艳,杨倩倩.基于跨语本体重用的维语本体构建方法[J].计算机工程与应用,2015,51(11):104-108. 被引量：1
9帕力旦.吐尔逊,房鼎益.融合形态特征的最大熵维吾尔语词性标注[J].西北大学学报（自然科学版）,2015,45(5):721-726. 被引量：1
10艾孜尔古丽,米尔夏提,玉素甫.艾白都拉.现代维吾尔语词干词类标注标记集验证性研究[J].计算机工程与科学,2015,37(12):2318-2323. 被引量：2

同被引文献24

1曹若麟,杜渂.面向实体标注的公安警情领域语料库的构建[J].电信快报,2021(3):20-24. 被引量：2
2钱佼汝.“文学性”和“陌生化”——俄国形式主义早期的两大理论支柱[J].外国文学评论,1989(1):26-32. 被引量：31
3邱质朴.试论语言资源的开发——兼论汉语面向世界问题[J].语言教学与研究,1981(3):111-123. 被引量：53
4陈章太.语言研究的一项重要的基础工程——评《现代汉语方言音库》[J].语言文字应用,2000(3):104-109. 被引量：1
5无,范俊军（译）,宫齐（译）,胡鸿雁（译）.语言活力与语言濒危[J].民族语文,2006(3):51-61. 被引量：97
6戴庆厦.“濒危语言热”二十年[J].云南师范大学学报（哲学社会科学版）,2012,44(4):1-6. 被引量：19
7“湖南方言调查‘响应'计划”项目启动[J].方言,2015,37(3):231-231. 被引量：2
8田立新.中国语言资源保护工程的缘起及意义[J].语言文字应用,2015(4):2-9. 被引量：52
9曹志耘.跨越鸿沟——寻找语保最有效的方式[J].语言文字应用,2017(2):2-8. 被引量：20
10王莉宁.语言资源保护与影视典藏[J].语言文字应用,2017(2):9-18. 被引量：11

引证文献2

1陈山青,段强.广播影视领域语言资源保护探论[J].铜仁学院学报,2022,24(5):86-93.
2德吉措,安见才让.面向藏文文本的人物关系抽取语料库的构建[J].青海科技,2024,31(1):81-86.

1雷露.多维度构建中高校商务英语语料库的完善[J].科教文汇,2019,0(31):180-181. 被引量：1
2索南才让.藏语语料库语言学的研究内容与应用[J].青海师范大学学报（藏文版）,2019(2):49-57.
3周毛太,祁坤钰,扎西才郎.基于语料库的藏英动词时态对比研究[J].中国民族博览,2019(1):108-110.
4王争.核心素养下小学语文高效阅读课堂的构建分析[J].最漫画·学校体音美,2018,0(32):00163-00163.
5许兴汉.从王恩茂学维语说起[J].大江南北,2013,0(11):33-33.
6凤建煌.职业艺术院校就业指导新局面构建分析[J].戏剧之家,2019,0(32):155-156.
7包乌日汗.浅谈小学蒙语文教学中的创新与反思[J].中学生作文指导,2019,0(14):42-42.
8李强.闹市里的自来水厂[J].北京纪事,2019,0(11):61-63.
9郎秀花.高中体育“趣味、互动、竞争”课堂构建分析[J].学周刊,2019,0(36):154-154. 被引量：3
10库尔班·乃木,吐尔洪·吐尔逊,祖菲娅·吐尔迪.新疆维吾尔族失语症康复治疗体会[J].医学信息（医学与计算机应用）,2016,29(28):84-85.

无线互联科技

2019年第19期

浏览历史

内容加载中请稍等...

面向信息处理的少数民族语料库构建分析被引量：2

参考文献4

二级参考文献21

共引文献29

同被引文献24

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向信息处理的少数民族语料库构建分析 被引量：2

参考文献4

二级参考文献21

共引文献29

同被引文献24

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向信息处理的少数民族语料库构建分析被引量：2