摘要
论述当前语料库建设的最新发展趋势以及建立我国大规模、国家级科学技术语料库对应用于科技信息领域的自然语言处理技术、知识技术等智能信息技术研究发展的意义和重要性,探讨国家科技语料库的建设目标、设计原则、加工功能、组成结构及其他一些相关问题,目的是推动我国科技语料库的建设,并得到国家有关部门的关注与支持。
This paper discusses the latest trends of corpus development, and the significance and importance of building Chinese National Corpus of Scientific and Technical Texts (CNCST) to the R&D of natural language technology and knowledge technology applied to the field of scientific and technical information service. It also discusses the construction objectives, design principles, annotation types, organizational structure and other related problems of CNCST, for the purpose of obtaining the attention and support from the relevant departments of the governments.
出处
《图书情报工作》
CSSCI
北大核心
2010年第6期102-106,共5页
Library and Information Service
基金
"十一五"国家科技支撑计划项目"多语言信息服务环境关键技术研究与应用"(项目编号:2006BAH03B02)研究成果之一
关键词
自然语言处理
科学技术语料库
句法树库
语料标注
natural language processing corpus of scientific and technical texts tree bank corpus annotation