摘要
经过自20世纪60年代至今近50年的发展,语料库的种类、应用领域及相关技术正在不断扩展。然而,语料库的建设与检索常常涉及文本预处理、文本标注、词表制作、字符块匹配、搭配分析、句型查找等诸多模式匹配问题,这对于绝大部分语言研究者和外语教学者来讲是一个相当大的技术难题,也是制约语料库建设与推广运用的主要障碍。在语料库建库与检索中,我们常常可以利用功能强大的正则表达式结合相关检索软件,对文本进行模式匹配,从而准确、高效的提取各种所需信息。本文主要探讨如何使用正则表达式解决语料库建库与检索中的模式匹配问题。
出处
《中州大学学报》
2011年第1期121-125,共5页
Journal of Zhongzhou University