期刊文献+

词性赋码语料库的检索与正则表达式的编写 被引量:22

原文传递
导出
摘要 标注可以为语料库带来增值(added value)(Leech 1997),这一思想已经逐渐成为语料库语言学界的共识,因而标注语料库也逐渐成为大型语料库最基本的规范之一。在外语教学与研究中,我们常常可以利用功能强大的正则表达式(regularexpressions)对词性赋码语料库进行检索并从中提取各种所需信息。然而,由于正则表达式中所使用的各种符号有别于自然语言中的词语,对于绝大部分从事语言教学、语言学习和语言研究的人来说不无难度,又由于检索是语料库操作中最重要的环节之一,如何有效使用正则表达式对语料库进行检索成为语料库教学和研究中的难题之一。本文分析了词性赋码语料检索的基本特点,介绍了一种由研究者自行设计的针对词性赋码语料库检索的正则表达式编辑环境,并对如何使用这一环境编写正则表达式在词性赋码语料库中检索进行了探讨。
作者 梁茂成
机构地区 北京外国语大学
出处 《中国外语教育》 2009年第2期65-73,81,共10页 Foreign Language Education in China(Quarterly)
基金 教育部哲学社会科学研究项目(编号06JA740007)的部分研究成果
  • 相关文献

参考文献4

  • 1Leech,G.Introducing corpus annotation[].Corpus Annotation: Linguistic Information from Computer Text Corpora.1997
  • 2D Jurafsky,JH Martin.Speech and language processing[]..2009
  • 3LAWLER J,DRY H A.Using Computers in Linguistics:A Practical Guide[]..1998
  • 4Teubert,W.My version of corpus linguistics[].International Journal of Corpus Linguistics.2005

引证文献22

二级引证文献55

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部