摘要
中文分词是中文信息处理的基础,分词系统也是中文信息处理中的一个主要组成部分,对中文文本的分词处理目前已经应用到了中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统等领域。本文对现有的中文分词技术进行了综述,分析了现有分词方法的技术特点,指出了部分分词方法存在的优缺点。
Word segmentation is the basis of the Chinese language processing and word segmentation system is the major components of the Chinese language processing,the word segmentation in Chinese text has been widely used in the domain chinese natural language understanding、literature retrieval、search engine、text mining system and so on.This paper provides an overview of Chinese Word segmentation technology,analyses the technical characteristics of the existing word segmentation methods,points out the advantages and disadvantages of some word segmentation methods.
出处
《安阳师范学院学报》
2010年第2期54-56,共3页
Journal of Anyang Normal University
关键词
分词
中文信息处理
分词方法
Word Segmentation
Chinese language processing
Word Segmentation method