摘要
介绍了汉语词性自动标注系统的设计与实现.该系统实现了统计与规则相结合的方法进行汉语词性自动标注.描述了该系统的总体结构,以及所使用的非兼类词表、兼类词表、标记集和词性标注规则的组织,特别对稀疏矩阵及其存储方法进行了详细的介绍。
In this paper, the Chinese part-of-speech automatic tagging system is presented, which has implemented statistics-based and rulebased tagging methods, introduced its whole structure and organized a series of word tables such as the ambiguous word table, nonambiguous word table, tag-set and POS tagging rules. Especially, the processing and storing methods of sparse matrix arc described in more detail.
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第3期7-8,65,共3页
Computer Engineering
基金
国家自然科学基金项目(69575011)
国家863项目(863-306-ZT03-03-1)
山西省自然科学基金项目(99
关键词
汉语词性自动标注系统
自然语言理解
语料库
神经网络
设计
Part-of-speech automatic tagging
Word table
Corpus
Rough set
Collocation mode
Statistic model