摘要
要实现自然语言处理 (naturallanguageprocessing ,NLP)的各种目标 ,首要问题是语言知识库的建造。词汇知识库是语言知识库的基础部分 ,也是核心组成部分 ,因为词是最小的能够独立运用的语言单位 ,在语言单位层级链中处于中心环节 ,是语言系统中的基本层次单位。所以 ,自然语言的自动化处理首先离不开对词“可计算性”的处理。我们建造的俄语词汇知识库 (Лексическаябазаданныхрусскогоязыка ,简称ЛБД)正是为实现自然语言处理的各种目标而设计的基础性功能模块。概括地说 ,就是以词为基本操作单位和描述主题 ,以一定组织形式表示和存储这些单位相关语言信息的仓库。它既涉及许多理论问题 ,也体现诸多语言工程技术。本文只局限于展现ЛБД在NLP中的作用和运作机制 ,具体为 :1)ЛБД在形态自动分析中的运作机制 ;2 )ЛБД在句法自动分析中的运作机制 ;3)ЛБД在语义自动分析中的运作机制 ;4)ЛБД在篇章自动分析中的运作机制。
出处
《外语学刊》
CSSCI
北大核心
2002年第3期95-99,共5页
Foreign Language Research