期刊文献+

汉语盲文语料库建设方案 被引量:8

Construction of a Chinese Braille Corpus
下载PDF
导出
摘要 本文提出了一个汉语盲文语料库的建设方案。由于现行盲文在分词连写和标调方面的特点,汉语盲文研究难以直接使用明眼文语料库,需要建设专门的语料库。论文拟建设的语料库是一个大规模的(约1000万方盲文)、经过语言信息和触觉信息多层级对照标注的语料库。该语料库的建设可促进对我国盲文发展全貌的把握和了解,促进盲文基础研究和信息化、规范化研究,助力盲人信息无障碍水平提升。论文从语料库选材原则和样本采集、语料标注规范和标注方案、辅助软件研发计划等几个方面详细说明了盲文语料库建设的主要内容和初步方案,并进一步指出其重点和难点问题。 The paper presents a design for the construction of a Chinese Braille corpus, which is needed because Chinese Braille has distinctive features in terms of the writing of particles and of intonations, different from normal Chinese characters. The corpus designed in this paper is of about 10 million characters, and it is tagged with linguistic and touching information. The corpus is of both theoretical and practical significance in deepening the understanding of Chinese Braille, promoting fundamentalresearch, information research and standardization research, and improving the accessibility of the Braille. The paper explains the construction of the corpus in terms of material selection and collection, corpus annotation and assistant software development, and points out important and difficult issues in the construction process.
作者 肖航 钟经华
出处 《语言文字应用》 CSSCI 北大核心 2015年第3期109-118,共10页 Applied Linguistics
基金 国家社科基金重大项目"汉语盲文语料库建设研究"(编号:13&ZD187) 国家语委科研项目"基于云计算平台的语言资源整合应用方略研究"(编号:YB125-38)资助
关键词 汉语盲文 盲文语料库 语料选材 语料标注 Chinese braille braille corpus material selection corpus annotation
  • 相关文献

参考文献13

  • 1Biber D. , 1993 ,Representativeness in Corpus Design [ J]. Literary and Linguistics Computing.
  • 2Garside R. ,Leech G. ,1997 ,McEnery A. ,Corpus Annotation [ M]. Longman; New York.
  • 3Kennedy G. , 1998, An Introduction to Corpus Linguistics [ M ]. Longman; London; New York.
  • 4Leech G. , 1993,Corpus annotation schemes [ J]. Literary and Linguistic Computing.
  • 5McEnery T. ,Wilson A. , 1996, Corpus Linguistics [ M ]. Edinburgh University Press.
  • 6GB/T15720-2008中国盲文[S].北京:中国标准出版社,2008.
  • 7GB/T16159--2012汉语拼音正词法基本规则[S].北京:中国标准出版社,2012.
  • 8江铭虎,朱小燕,夏莹,谭刚,包塔.基于多种知识的盲文翻译的研究[J].清华大学学报(自然科学版),2000,40(9):69-73. 被引量:7
  • 9靳光瑾,肖航,富丽,章云帆.现代汉语语料库建设及深加工[J].语言文字应用,2005(2):111-120. 被引量:46
  • 10李伟洪,滕伟民.中国盲文[M].北京:华夏出版社,1996.

二级参考文献16

共引文献79

同被引文献32

引证文献8

二级引证文献19

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部